kaldi中文语音识别平台的搭建——运行thchs30

kaldi资料的准备:《Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)》

运行kaldi中的自带样例:《Kaldi学习笔记(四)——thchs30中文在线识别》

thchs30的主要搭建过程参照以上两篇博客,此处就不再赘述。但是在搭建的过程中可能会出现一些问题,由于kaldi目前网上的资料比较少,很多问题搜不到,都是自己一个坑一个坑地填过来的,因此打算在这里记录一下,提示后来人。

1、跑完训练数据后,tri1中没有出现HCLG.fst和words.txt这两个文件

原因:很可能是内存不够,我之前用的8G内存,跑完也没出来。后来给了10G,才跑出来。如果用虚拟机跑的话,跑的过程中建议不要做其他事,可以放在半夜跑。

2、采样率不支持的问题,报错信息如下

Sampling rates other than 16kHz are not supported

建议:下载格式工厂,把音频的采样率转化为16K

3、tri1非常不准确,有条件的还是要用个服务器跑下dnn

我的音频文件是“需要的,不需要,需要的,不需要”。但是识别出来是下面这个样子。。。我自己都懵逼了。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值