语音识别语言模型和拼音字典文件制作

栏目: 编程工具 · 发布时间: 6年前

内容简介:接我前面的文章,下载 pocketsphinx 和 中文模型文件。由于模型文件格式有一些要求,所以建议对模型文件的编辑都在Linux上完成。创建一个文本文件 my.txt,内容如下:

接我前面的文章,下载 pocketsphinx 和 中文模型文件。

由于模型文件格式有一些要求,所以建议对模型文件的编辑都在 Linux 上完成。

准备中文语言文件

创建一个文本文件 my.txt,内容如下:

测试
直走
左转
右转
后退
开火
靠喽

生成语音模型文件和字典文件

访问 http://www.speech.cs.cmu.edu/tools/lmtool-new.html 页面,上传 my.txt 文件,然后使用“COMPILE KNOWLEDGE BASE”来生成模型文件。

在生成的列表页面,下载最下面的那个 TAR<???>.tgz,文件名是动态产生的,这里我生成的文件名为:TAR2007.tgz。

下载之。

解压之。

编辑其下的 2007.dic 文件,参考 zh_broadcastnews_utf8.dic 文件加入拼音,比如:

右转 y ou zh uan
后退 h ou t ui
左转 z uo zh uan
开火 k ai h uo
测试 c e sh ib
前进 q ian j in
靠喽 k ao l ou

使用 pocketsphinx_continuous 工具测试,这里使用了一个我提前录制好的音频文件来做测试,其中参数路径根据自己具体文件位置修改。

pocketsphinx_continuous -hmm test/zh_broadcastnews_ptm256_8000 -lm test/TAR2007/2007.lm -dict test/TAR2007/2007.dic -infile test/small.wav

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

群体智能

群体智能

James Kennedy、Russell C Eberhart、Yuhui Shi / 人民邮电出版社 / 2009-2-1 / 75.00元

群体智能是近年来发展迅速的人工智能学科领域.通过研究分散,自组织的动物群体和人类社会的智能行为, 学者们提出了许多迥异于传统思路的智能算法, 很好地解决了不少原来非常棘手的复杂工程问题.与蚁群算法齐名的粒子群优化(particle swarm optimization, 简称PSO)算法就是其中最受瞩目,应用最为广泛的成果之一. 本书由粒子群优化算法之父撰写,是该领域毋庸置疑的经典著作.作者......一起来看看 《群体智能》 这本书的介绍吧!

UNIX 时间戳转换
UNIX 时间戳转换

UNIX 时间戳转换

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

HSV CMYK 转换工具
HSV CMYK 转换工具

HSV CMYK互换工具