语音识别语言模型和拼音字典文件制作

内容简介：接我前面的文章，下载 pocketsphinx 和中文模型文件。由于模型文件格式有一些要求，所以建议对模型文件的编辑都在Linux上完成。创建一个文本文件 my.txt，内容如下：

接我前面的文章，下载 pocketsphinx 和中文模型文件。

由于模型文件格式有一些要求，所以建议对模型文件的编辑都在 Linux 上完成。

准备中文语言文件

创建一个文本文件 my.txt，内容如下：

测试
直走
左转
右转
后退
开火
靠喽

生成语音模型文件和字典文件

访问 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 页面，上传 my.txt 文件，然后使用“COMPILE KNOWLEDGE BASE”来生成模型文件。

在生成的列表页面，下载最下面的那个 TAR<???>.tgz，文件名是动态产生的，这里我生成的文件名为：TAR2007.tgz。

下载之。

解压之。

编辑其下的 2007.dic 文件，参考 zh_broadcastnews_utf8.dic 文件加入拼音，比如：

右转 y ou zh uan
后退 h ou t ui
左转 z uo zh uan
开火 k ai h uo
测试 c e sh ib
前进 q ian j in
靠喽 k ao l ou

使用 pocketsphinx_continuous 工具测试，这里使用了一个我提前录制好的音频文件来做测试，其中参数路径根据自己具体文件位置修改。

pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持码农网

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

奔跑吧 Linux内核

张天飞 / 人民邮电出版社 / 2017-9-1 / CNY 158.00

本书内容基于Linux4.x内核，主要选取了Linux内核中比较基本和常用的内存管理、进程管理、并发与同步，以及中断管理这4个内核模块进行讲述。全书共分为6章，依次介绍了ARM体系结构、Linux内存管理、进程调度管理、并发与同步、中断管理、内核调试技巧等内容。本书的每节内容都是一个Linux内核的话题或者技术点，读者可以根据每小节前的问题进行思考，进而围绕问题进行内核源代码的分析。本书内......一起来看看《奔跑吧 Linux内核》这本书的介绍吧!

码农工具