DeepASMR: LLM-Based Zero-Shot ASMR Speech Generation for Anyone of Any Voice
Leying Zhang, Tingxiao Zhou, Haiyang Sun, Mengxiao Bi, Yanmin Qian
上海交通大学 · 计算机科学与工程系
Auditory Cognition & Computational Acoustics

文章回顾了上海交通大学听觉认知与计算声学实验室2025年在科研创新、人才培养和学术交流方面的辉煌成就,包括论文发表、模型发布、团建活动、荣誉奖项等多个方面。

钱彦旻教授凭借在听觉人工智能领域的卓越科研成就,荣获第二届睿远青年科技奖信息与空间科技奖。他的创新研究有效解决了长期困扰该领域的“鸡尾酒会难题”,为听觉处理及语音交互技术的大规模应用奠定了技术基础。

上海交通大学联合多所高校和企业在2024年DCASE国际挑战赛中,荣获低复杂度声学场景分类和工业设备异常声音检测两项冠军,以及自动音频字幕生成赛道的季军。

在本文中,我们提出了 MeanSE,这是一种利用平均流(Mean Flow)的高效生成式语音增强模型,该模型通过建模平均速度场来实现高质量的单次函数评估增强。实验结果表明,在单次函数评估条件下,我们提出的 MeanSE 显著优于流匹配基线
Leying Zhang, Tingxiao Zhou, Haiyang Sun, Mengxiao Bi, Yanmin Qian
Bei Liu, Yanmin Qian
Yoshiki Masuyama, Xuankai Chang, Wangyou Zhang, Samuele Cornell, Zhong-Qiu Wang, Nobutaka Ono, Yanmin Qian, Shinji Watanabe
Wangyou Zhang, Zhengyang Chen, Chenda Li, Yanmin Qian
Haiyang Sun, Shujie Hu, Shujie Liu, Lingwei Meng, Hui Wang, Bing Han, Yifan Yang, Yanqing Liu, Sheng Zhao, Yan Lu, Yanmin Qian
Chenda Li, Wei Wang, Samuele Cornell, Bing Han, Leying Zhang, Zhengyang Chen, Shinji Watanabe, Yanmin Qian
欢迎博士、硕士和博士后申请。