研究领域
- 语音和语言大模型
- 语音音频自监督大模型
- 语音和音乐生成大模型
- 多模态和跨模态大模型
- 通用大模型高效化设计
- 听觉信号处理与脑认知
- 智能语音处理技术
- 语音的识别与翻译
- 语音的增强与分离
- 语音麦克风阵列处理
- 说话人与语种识别
- 可控自然语音合成
- 语音情感感知识别
- 丰富音频处理技术
- 声学事件分析与检测
- 丰富音频检索与分类
- 音乐生成理解与编辑
- 语音音频仿冒与鉴伪
科研成果
实验室连续取得一系列具有国际影响力的研究成果。在2020年获得了“吴文俊人工智能科学技术奖-自然科学一等奖”。此外,实验室多次参加国际评测,并获得冠军,如:CNSRC说话人识别挑战赛, CSRC语音识别挑战赛,DCASE音频场景事件检测挑战赛等。
实验室在语音和语言大模型建模、语音识别与翻译、语音抗噪与分离、说话人识别、语音合成与理解、多模态和跨模态信息处理等多个领域取得重要成果。自2019年近5年以来,近20篇相关期刊被录用至语音领域顶级期刊IEEE/ACM Transactions on Audio, Speech, and Language Processing等, 120余篇相关论文被录用至NeurIPS,ICASSP,INTERSPEECH等顶级国际会议。曾获得ISCSLP 2016最佳学生论文、IEEE ASRU 2019最佳论文、2019 Speech Communication期刊最佳论文奖。
实验室的研究生同学还曾获得谷歌博士奖研金、微软学者奖学金、杨元庆奖学金、国家奖学金等,多位本科生同学获评校级优秀毕业论文、市级和校级优秀毕业生等。
毕业生去向
实验室共已培养博士和硕士毕业生20余人,以及几十位本科毕业生。其中多名学生毕业之后,继续在卡内基梅隆大学,约翰霍普金斯大学,剑桥大学等国际知名学府继续深造。
数十位学生毕业后前往Google、Microsoft、百度、阿里巴巴、腾讯、华为、字节跳动、网易、美团等海内外大型科技公司就业,其中不乏在面试中脱颖而出,拿到华为天才少年、腾讯青云计划、阿里星等顶级offer的优秀同学。
在校就读期间,实验室鼓励学生外出交流与学习,每一位研究生同学都可以得到不少于1次在海内外大型科技企业或者研究机构的实习与访学机会。与微软亚洲研究院、阿里巴巴达摩院、腾讯AILab以及Google、MSR、卡内基梅隆大学、剑桥大学等国内外顶尖研究机构、企业和高校存在良好合作交流关系。
日常活动
实验室的日常活动丰富多样,学术与生活紧密交织。定期举办生日会和集体聚餐,加深了组内同学和老师的了解,让大家在轻松氛围中交流生活点滴,增进彼此的感情。此外,实验室每年举办两次外出团建活动,在大自然中加强团队凝聚力和创造力。
实验室注重学生的身心健康,在课余时间举办了丰富的文化和体育活动,通过羽毛球、篮球、游泳等体育运动,让大家在忙碌的研究之余能够强身健体,释放压力。
同时,实验室十分注重学生的福利。统一安排水果供应,为大家补充维生素,保持良好的工作状态。夏日炎炎时,贴心的雪糕福利更是带来了清凉与愉悦,为同学们的学术研究提供舒适的氛围和环境。