语情动态  
» 语情动态
» 语情月报
» 《中国语情》
» 新词新语
» 语情记忆

 
·当前位置: 首页 > 中国语情 > 语情动态
全球顶级声纹识别竞赛落幕 中国团队获得双料冠军
发布日期:2020-07-31 22:05:18   点击:

(来源:人民网  2020724日)

近日,全球最大的语音会议INTERSPEECH 2020公布了SdSV声纹识别比赛成绩,来自中国的网易AI Lab 从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。

据了解,INTERSPEECH会议是全球最大的综合性语音信号处理领域的科技盛会,业内享有极高的声誉,对参与企业有着严苛的准入门槛要求。本次国际声纹识别比赛的参赛队伍来自国际多家知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等。

比赛采用 MinDCF(最小检测代价)和 EER(等错误率)作为评测指标。网易 AI Lab 的单模型在两个指标均为最佳,其中 EER 达到了 1.67%,相比第二名降低了 11.6%,并远低于比赛 X-Vector 基线系统(EER=9.05%)。

除了在综合指标上的领先外,网易 AI Lab 基于常见的 X-Vector PLDA 算法,创新地提出了一种 ASR-free 的文本相关声纹识别算法。相比传统的 Deep Speaker Embedding 方法,该算法不需要依赖语音识别, 就能够在多语言环境下,同时完成说话人和文本内容的验证。

声纹识别技术以往多应用于安防等场景中,而网易 AI Lab 则创新性的将声纹识别技术与游戏场景结合,除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手。





版权所有 © 2015 中国语情与社会发展研究中心
地址:武汉市武昌区 武汉大学振华楼文学院604室

邮编:430072 电话:027-68752425 投稿邮箱:zgyq@whu.edu.cn