实验室介绍

研究领域

语音和语言大模型
- 语音音频自监督大模型
- 语音和音乐生成大模型
- 多模态和跨模态大模型
- 通用大模型高效化设计
- 听觉信号处理与脑认知
智能语音处理技术
- 语音的识别与翻译
- 语音的增强与分离
- 语音麦克风阵列处理
- 说话人与语种识别
- 可控自然语音合成
- 语音情感感知识别
丰富音频处理技术
- 声学事件分析与检测
- 丰富音频检索与分类
- 音乐生成理解与编辑
- 语音音频仿冒与鉴伪

科研成果

实验室连续取得一系列具有国际影响力的研究成果。在2020年获得了“吴文俊人工智能科学技术奖-自然科学一等奖”。此外，实验室多次参加国际评测，并获得冠军，如：CNSRC说话人识别挑战赛， CSRC语音识别挑战赛，DCASE音频场景事件检测挑战赛等。

实验室在语音和语言大模型建模、语音识别与翻译、语音抗噪与分离、说话人识别、语音合成与理解、多模态和跨模态信息处理等多个领域取得重要成果。自2019年近5年以来，近20篇相关期刊被录用至语音领域顶级期刊IEEE/ACM Transactions on Audio, Speech, and Language Processing等， 120余篇相关论文被录用至NeurIPS，ICASSP，INTERSPEECH等顶级国际会议。曾获得ISCSLP 2016最佳学生论文、IEEE ASRU 2019最佳论文、2019 Speech Communication期刊最佳论文奖。

实验室的研究生同学还曾获得谷歌博士奖研金、微软学者奖学金、杨元庆奖学金、国家奖学金等，多位本科生同学获评校级优秀毕业论文、市级和校级优秀毕业生等。

毕业生去向

实验室共已培养博士和硕士毕业生20余人，以及几十位本科毕业生。其中多名学生毕业之后，继续在卡内基梅隆大学，约翰霍普金斯大学，剑桥大学等国际知名学府继续深造。

数十位学生毕业后前往Google、Microsoft、百度、阿里巴巴、腾讯、华为、字节跳动、网易、美团等海内外大型科技公司就业，其中不乏在面试中脱颖而出，拿到华为天才少年、腾讯青云计划、阿里星等顶级offer的优秀同学。

在校就读期间，实验室鼓励学生外出交流与学习，每一位研究生同学都可以得到不少于1次在海内外大型科技企业或者研究机构的实习与访学机会。与微软亚洲研究院、阿里巴巴达摩院、腾讯AILab以及Google、MSR、卡内基梅隆大学、剑桥大学等国内外顶尖研究机构、企业和高校存在良好合作交流关系。

日常活动

实验室的日常活动丰富多样，学术与生活紧密交织。定期举办生日会和集体聚餐，加深了组内同学和老师的了解，让大家在轻松氛围中交流生活点滴，增进彼此的感情。此外，实验室每年举办两次外出团建活动，在大自然中加强团队凝聚力和创造力。

实验室注重学生的身心健康，在课余时间举办了丰富的文化和体育活动，通过羽毛球、篮球、游泳等体育运动，让大家在忙碌的研究之余能够强身健体，释放压力。

同时，实验室十分注重学生的福利。统一安排水果供应，为大家补充维生素，保持良好的工作状态。夏日炎炎时，贴心的雪糕福利更是带来了清凉与愉悦，为同学们的学术研究提供舒适的氛围和环境。

联系方式

研究领域

科研成果

毕业生去向

日常活动