语音识别语言模型和拼音字典文件制作

栏目: 编程工具 · 发布时间: 5年前

内容简介:接我前面的文章,下载 pocketsphinx 和 中文模型文件。由于模型文件格式有一些要求,所以建议对模型文件的编辑都在Linux上完成。创建一个文本文件 my.txt,内容如下:

接我前面的文章,下载 pocketsphinx 和 中文模型文件。

由于模型文件格式有一些要求,所以建议对模型文件的编辑都在 Linux 上完成。

准备中文语言文件

创建一个文本文件 my.txt,内容如下:

测试
直走
左转
右转
后退
开火
靠喽

生成语音模型文件和字典文件

访问 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 页面,上传 my.txt 文件,然后使用“COMPILE KNOWLEDGE BASE”来生成模型文件。

在生成的列表页面,下载最下面的那个 TAR<???>.tgz,文件名是动态产生的,这里我生成的文件名为:TAR2007.tgz。

下载之。

解压之。

编辑其下的 2007.dic 文件,参考 zh_broadcastnews_utf8.dic 文件加入拼音,比如:

右转 y ou zh uan
后退 h ou t ui
左转 z uo zh uan
开火 k ai h uo
测试 c e sh ib
前进 q ian j in
靠喽 k ao l ou

使用 pocketsphinx_continuous 工具测试,这里使用了一个我提前录制好的音频文件来做测试,其中参数路径根据自己具体文件位置修改。

pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

恰如其分的软件架构

恰如其分的软件架构

George Fairbanks / 张逸、倪健、高翌翔 / 华中科技大学出版社 / 2013-9-1 / 88.00

本书描述了一种恰如其分的软件架构设计方法。作者建议根据项目面临的风险来调整架构设计的成本,并从多个视角阐述了软件架构的建模过程和方法,包括用例模型、概念模型、域模型、设计模型和代码模型等。本书不仅介绍方法,而且还对方法和概念进行了归类和阐述,将软件架构设计融入开发实践中,与 敏捷开发方法有机地结合在一起,适合普通程序员阅读。 . 这是一本超值的书,案例丰富有趣,言简意赅,阅读轻松。当年......一起来看看 《恰如其分的软件架构》 这本书的介绍吧!

HTML 压缩/解压工具
HTML 压缩/解压工具

在线压缩/解压 HTML 代码

随机密码生成器
随机密码生成器

多种字符组合密码

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具