SpeechColab排行榜:一个开源的语音识别评测平台

随着深度学习在过去十年间的蓬勃发展,自动语音识别(ASR)技术获得了广泛关注,促使大量公开可用的ASR系统应运而生,并正积极融入我们的日常生活。然而,由于各种细微差异的存在,对这些ASR系统进行公正且可复现的评估面临挑战。本文介绍了SpeechColab评测平台——一个专为ASR评估设计的通用开源平台。通过该平台:
  • 我们报告了一项全面的基准测试,揭示了当前ASR系统的最新技术全景,涵盖多个开源模型与商业服务;

  • 我们量化了评分流程中不同细微差异对最终基准结果的影响,包括大写、标点、感叹词、缩略形式、同义词使用、复合词等问题,这些因素在端到端ASR系统转型背景下显得尤为重要;

  • 受Kolmogorov复杂度和归一化信息距离(NID)的启发,我们提出并讨论了对传统字/词Token错误率(TER)指标的改进型修正——mTER,该改进指标具有归一化特性,且在参考文本与识别文本之间保持对称性。

平台访问地址:https://github.com/SpeechColab/Leaderboard

论文引用:

J. Du, J. Li, G. Chen, and W.-Q. Zhang, “SpeechColab leaderboard: An open-source platform for automatic speech recognition evaluation,” Computer Speech & Language, vol. 94, art. no. 101805, Nov. 2025, doi: 10.1016/j.csl.2025.101805.

论文免费下载地址(截止到2025年6月18日):

https://authors.elsevier.com/a/1l0DJ39HpStari

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值