第三届全球DIHARD语音分析挑战赛成绩公布！有光科技斩获全球top5佳绩！祝贺！

在日常的商务电话(例如：客户服务热线)或会议中很多时都会录音作跟进或分析，当我们想透过自动语音识别 (ASR)技术把录音对话转为文本时，话者分离技术 (Diarization )是一个至为关键的过程。因为录音时，对话中所有讲话者的语音都会被记录到录音系统的同一声音轨道上，而话者分离技术就是把于轨道上不同讲话者的声音分辨出来，准确地分辨出何人在何时说了什么，因此，好的话者分离技术能直接提升ASR的准确性。

同时间，话者分离技术亦可带动语音分析 (Speech Analytics)到一个新的层次。现今越来越多企业希望利用大数据分析，透过与客户的对话了解客户的行为和想法，从而得出业务洞见 (Business Insight)或可改善业务/服务的地方。此外，监管机构亦为企业(特别是金融机构)制定许多合规政策以供业界遵循：企业需要确保其员工遵守这些合规政策以免受到监管机构处罚。因此，准确了解客户和员工的对话变得更加重要，而市场对话者分离技术需求亦不段增加。

去研发一个准确、可靠的话者分离技术，当中的困难不单是将多名讲话者的语音分辨出，事实上亦需要处理背景噪音、侧语音、重叠语音、短句子等挑战。

有光科技 (Fano Labs)的研究工程师梁晋溢 (“TY”)，在首席语音科学家Lahiru Thilina Samarakoon博士的协助下，代表公司首次参加了全球第三届DIHARD语音分析挑战赛(DIHARD III)。挑战赛的评分内容是进行准确的话者分离，就是在一个多讲话者的录音中分辨出”谁人在什么时候说什么”。 TY利用了最新的人工智能技术 (Artificial Intelligence)，把比赛提供的声音轨道从零开始进行话者分离的技术分析，并获得全球Top 5的佳绩！这是一个非常杰出的成绩，展现出有光科技具备着国际领先的专业知识和能力，为客户提供专业顾问和服务。

DIHARD，由著名的语言数据联盟 (LDC)于2018年发起，本次是第三届，也是首次由美国国家标准与技术研究院 (NIST)参与联合主办，大大提升了比赛的权威性和影响力。 DIHARD系列赛持续吸引了国内外一流的研究机构，包括约翰霍普金斯大学、布尔诺理工大学、昆山杜克大学、南加州大学、牛津大学等顶尖团队。此次挑战旨在针对话者分离技术分别出不同录音设备、背景噪音、对话源的准确性。话者分离会以2种细分的话语情况以及11种不同的声音源进行评估，当中包括有声书、会议对话、网上影片及首次加入的电话对话。有光科技在话者分离技术取得优异成绩，未来亦会把技术应用在不同的解决方案中，以帮助客户于不同场境中的需要。

第三届全球DIHARD语音分析挑战赛成绩公布！有光科技斩获全球top5佳绩！祝贺！

联系我们

微信扫一扫关注我们