新闻动态

【论文速递】IEEE T-ASLP论文:面向低资源语音识别的通用跨语言数据增广
这篇论文提出了一种名为SpliceTTS的创新自监督学习框架,旨在改善低资源语言的自动语音识别(ASR)系统性能。通过将HuBERT自监督学习单元将高资源语言的语音片段用于低资源语言语音片段的“拼接”,SpliceTTS能够有效扩展训练数据集,从而在无需额外标注数据的情况下,显著提高ASR模型的准确率。此外,通过引入置信度采样方法,SpliceTTS可以精准地选取有助于模型训练的语音段,加速模型收...…
in 科研成果
龙行龘龘,前程朤朤|上海交通大学听觉认知与计算声学实验室新春贺词
在新的一年里,上海交通大学听觉认知与计算声学实验室祝愿大家龙行天下,前程似锦!回顾2023年的大事盘点,实验室老师和同学们在科研探索中取得了丰富的成果。在语音识别与翻译、语音抗噪与分离、说话人识别、多模态和跨模态信息处理等领域,实验室取得了重要的研究成果。5篇相关论文被录用至IEEE/ACM Transactions on Audio, Speech, and Language Processin...…
in 其他
【论文速递】IEEE T-ASLP论文:高效的声纹识别模型构建方法
上海交通大学听觉认知与计算声学实验室的研究团队在近期发表了一篇名为“Depth-First Neural Architecture With Attentive Feature Fusion for Efficient Speaker Verification”的论文,被语音领域顶级期刊IEEE/ACM Transactions on Audio, Speech and Language Proc...…
in 科研成果
2024 共启新篇 | 听觉认知与计算声学实验室冬季团建顺利举行
在2023年12月23日,上海交通大学听觉认知与计算声学实验室(Auditory Cognition and Computational Acoustics Laboratory)举行了一场盛大的团建活动。这是实验室近两年来首次大型线下活动,由全组师生共同筹划参与。活动在上海近郊的蹦床主题公园举行,包含了多种蹦床游戏,如晃晃桥、垂直滑梯、高空攀岩等,以及之后的丢沙包、碰碰球、投篮、桌球等经典游戏。...…
in 实验室团建