News

【论文速递】IEEE T-ASLP|基于注意力-编码器-解码器的端到端说话人日志系统
上海交通大学的听觉认知与计算声学实验室近期发表了一篇名为“Attention-based Encoder-Decoder End-to-End Neural Diarization with Embedding Enhancer”的论文,被IEEE/ACM Transactions on Audio, Speech and Language Processing杂志接收。该研究首次应用了基于注意力...…
in Research
【论文+7】上海交通大学听觉认知与计算声学实验室7篇论文将在语音处理顶会ICASSP2024发表
2024年度声学、语音与信号处理国际会议(ICASSP 2024)将于2024年4月14日至19日在韩国首尔举行。上海交通大学听觉认知与计算声学实验室共有7篇论文被会议接收,包括语音增强、说话人识别、声音事件检测、模型压缩等方向。其中,基于语音离散化和声码器的生成式目标说话人抽取方法,通过结合先进的技术,实现了无干扰的高质量目标语音。此外,还有关于语音识别、语音合成、自然语言处理、机器学习等方面的...…
in Research
【论文速递】IEEE T-ASLP论文:基于簇感知DINO的高性能自监督说话人识别
这是关于上海交通大学听觉认知与计算声学实验室一篇名为“Self-Supervised Learning With Cluster-Aware-DINO for High-Performance Robust Speaker Verification”的论文被IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP)接...…
in Research
【论文速递】IEEE T-ASLP论文:面向低资源语音识别的通用跨语言数据增广
这篇论文提出了一种名为SpliceTTS的创新自监督学习框架,旨在改善低资源语言的自动语音识别(ASR)系统性能。通过将HuBERT自监督学习单元将高资源语言的语音片段用于低资源语言语音片段的“拼接”,SpliceTTS能够有效扩展训练数据集,从而在无需额外标注数据的情况下,显著提高ASR模型的准确率。此外,通过引入置信度采样方法,SpliceTTS可以精准地选取有助于模型训练的语音段,加速模型收...…
in Research