第三届全球DIHARD语音分析挑战赛成绩公布!有光科技斩获全球top5佳绩!祝贺!

在日常的商务电话(例如:客户服务热线)或会议中很多时都会录音作跟进或分析,当我们想透过自动语音识别 (ASR)技术把录音对话转为文本时,话者分离技术 (Diarization )是一个至为关键的过程。因为录音时,对话中所有讲话者的语音都会被记录到录音系统的同一声音轨道上,而话者分离技术就是把于轨道上不同讲话者的声音分辨出来,准确地分辨出何人在何时说了什么,因此,好的话者分离技术能直接提升ASR的准确性。

同时间,话者分离技术亦可带动语音分析 (Speech Analytics)到一个新的层次。现今越来越多企业希望利用大数据分析,透过与客户的对话了解客户的行为和想法,从而得出业务洞见 (Business Insight)或可改善业务/服务的地方。此外,监管机构亦为企业(特别是金融机构)制定许多合规政策以供业界遵循:企业需要确保其员工遵守这些合规政策以免受到监管机构处罚。因此,准确了解客户和员工的对话变得更加重要,而市场对话者分离技术需求亦不段增加。

去研发一个准确、可靠的话者分离技术,当中的困难不单是将多名讲话者的语音分辨出,事实上亦需要处理背景噪音、侧语音、重叠语音、短句子等挑战。

有光科技 (Fano Labs)的研究工程师梁晋溢 (“TY”),在首席语音科学家Lahiru Thilina Samarakoon博士的协助下,代表公司首次参加了全球第三届DIHARD语音分析挑战赛(DIHARD III)。挑战赛的评分内容是进行准确的话者分离,就是在一个多讲话者的录音中分辨出”谁人在什么时候说什么”。 TY利用了最新的人工智能技术 (Artificial Intelligence),把比赛提供的声音轨道从零开始进行话者分离的技术分析,并获得全球Top 5的佳绩!这是一个非常杰出的成绩,展现出有光科技具备着国际领先的专业知识和能力,为客户提供专业顾问和服务。

DIHARD,由著名的语言数据联盟 (LDC)于2018年发起,本次是第三届,也是首次由美国国家标准与技术研究院 (NIST)参与联合主办,大大提升了比赛的权威性和影响力。 DIHARD系列赛持续吸引了国内外一流的研究机构,包括约翰霍普金斯大学、布​​尔诺理工大学、昆山杜克大学、南加州大学、牛津大学等顶尖团队。此次挑战旨在针对话者分离技术分别出不同录音设备、背景噪音、对话源的准确性。话者分离会以2种细分的话语情况以及11种不同的声音源进行评估,当中包括有声书、会议对话、网上影片及首次加入的电话对话。有光科技在话者分离技术取得优异成绩,未来亦会把技术应用在不同的解决方案中,以帮助客户于不同场境中的需要。

广告位
联系我们

联系我们

13316818043

邮箱: marketing@saiia.org.cn

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部