实验室介绍

实验室介绍

联系方式

上海交通大学闵行校区, 电院3-502
audiocc.lab@sjtu.edu.cn

研究领域

  • 语音和语言大模型
    • 语音音频自监督大模型
    • 语音和音乐生成大模型
    • 多模态和跨模态大模型
    • 通用大模型高效化设计
    • 听觉信号处理与脑认知
  • 智能语音处理技术
    • 语音的识别与翻译
    • 语音的增强与分离
    • 语音麦克风阵列处理
    • 说话人与语种识别
    • 可控自然语音合成
    • 语音情感感知识别
  • 丰富音频处理技术
    • 声学事件分析与检测
    • 丰富音频检索与分类
    • 音乐生成理解与编辑
    • 语音音频仿冒与鉴伪

科研成果

实验室连续取得一系列具有国际影响力的研究成果。在2020年获得了“吴文俊人工智能科学技术奖-自然科学一等奖”。此外,实验室多次参加国际评测,并获得冠军,如:CNSRC说话人识别挑战赛, CSRC语音识别挑战赛,DCASE音频场景事件检测挑战赛等。

实验室在语音和语言大模型建模、语音识别与翻译、语音抗噪与分离、说话人识别、语音合成与理解、多模态和跨模态信息处理等多个领域取得重要成果。自2019年近5年以来,近20篇相关期刊被录用至语音领域顶级期刊IEEE/ACM Transactions on Audio, Speech, and Language Processing等, 120余篇相关论文被录用至NeurIPS,ICASSP,INTERSPEECH等顶级国际会议。曾获得ISCSLP 2016最佳学生论文、IEEE ASRU 2019最佳论文、2019 Speech Communication期刊最佳论文奖。

实验室的研究生同学还曾获得谷歌博士奖研金、微软学者奖学金、杨元庆奖学金、国家奖学金等,多位本科生同学获评校级优秀毕业论文、市级和校级优秀毕业生等。

毕业生去向

实验室共已培养博士和硕士毕业生20余人,以及几十位本科毕业生。其中多名学生毕业之后,继续在卡内基梅隆大学,约翰霍普金斯大学,剑桥大学等国际知名学府继续深造。

数十位学生毕业后前往Google、Microsoft、百度、阿里巴巴、腾讯、华为、字节跳动、网易、美团等海内外大型科技公司就业,其中不乏在面试中脱颖而出,拿到华为天才少年、腾讯青云计划、阿里星等顶级offer的优秀同学。

在校就读期间,实验室鼓励学生外出交流与学习,每一位研究生同学都可以得到不少于1次在海内外大型科技企业或者研究机构的实习与访学机会。与微软亚洲研究院、阿里巴巴达摩院、腾讯AILab以及Google、MSR、卡内基梅隆大学、剑桥大学等国内外顶尖研究机构、企业和高校存在良好合作交流关系。

日常活动

实验室的日常活动丰富多样,学术与生活紧密交织。定期举办生日会和集体聚餐,加深了组内同学和老师的了解,让大家在轻松氛围中交流生活点滴,增进彼此的感情。此外,实验室每年举办两次外出团建活动,在大自然中加强团队凝聚力和创造力。

实验室注重学生的身心健康,在课余时间举办了丰富的文化和体育活动,通过羽毛球、篮球、游泳等体育运动,让大家在忙碌的研究之余能够强身健体,释放压力。

同时,实验室十分注重学生的福利。统一安排水果供应,为大家补充维生素,保持良好的工作状态。夏日炎炎时,贴心的雪糕福利更是带来了清凉与愉悦,为同学们的学术研究提供舒适的氛围和环境。