基于Nuance的语音识别系统的设计

来源 :安徽大学 | 被引量 : 0次 | 上传用户:landgale527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术就是让机器能听懂人说话,并作出正确的反应从而执行相应的命令。语音识别技术作为一门交叉学科,它与声学、语音学、人工智能、数字信号处理、计算机学科等众多学科都有紧密联系。同时语音技术的应用逐渐成为一个具有竞争性的新兴高技术产业。近十年来,语音识别的产品也逐渐多起来,主要可以分为通用场合和专用场合两个方面。通用场合的识别率都比较低,一般都是大词汇量自然语流的语音识别,例如语音听写、语音短信、关键词检索、电话监控等。专用场合识别率都比较高,一般采用的词汇量小,部分采用孤立词识别,因此识别率大大提高,例如语音拨号、声控玩具、声控家电、语音点歌台、语音导航系统、语音股票系统、内线转接系统等。  本文就专有场合应用,对小词汇量,孤立词的识别,利用Nuance设计一个语音识别系统,具体的工作是:  1.介绍了语音识别的基本概念、孤立词语音识别的一般方法和特点。分析了语音识别的关键技术:特征提取技术、模式匹配准则及模型训练技术的基本原理。  2.分析Nuance涉及的关键技术:预处理、前端处理、识别搜索和自然语音理解,介绍Nuance的体系结构,并分析了一个典型的语音识别流程及其语法结构。  3.在系统实现上,利用WINDOWS下API函数进行采集音频数据,对初始化、采样格式和语音采集流程做了详细分析,实现了语音采集。并调用Windows Sockets DLL和WinSock API,通过UDP将语音数据实时传输到服务器。  4.在Nuance识别服务器端,分析Nuance的初始化、配置文件、语法结构和采集流程,实现接收来自客户端的语音数据、进行分析和识别处理,并将识别结果通过UDP实时传回到客户端。  5.此系统可以实现小词汇量识别,并成功地应用到安徽四创电子股份有限公司开发的应急指挥系统终端,实现语音控制代替手工拨号的功能。
其他文献
学位
混沌是20世纪重要的科学发现。自1963年Lorenz提出第一个混沌系统以来,引起了国内外研究者的关注。混沌研究从最初的理论阶段,逐渐上升到工程应用中去。特别是近年来混沌科学
随着微电子技术的不断发展,半导体工艺也不断向更小尺寸推进。由于受到器件性能要求的限制,目前主流的基于MOS结构的Flash非易失性存储器的可缩小性受到限制。为了克服当前非
近几年,在蔬菜生产中出现大量、频繁地使用各种化学农药来控制病虫害发生的现象。大量不合理地使用化学农药,破坏了菜田生态环境,天敌种群衰弱,病虫产生抗药性。为了确保产量
对比研究了常规与高MLSS(混合液悬浮固体浓度)条件下,A2/O(厌氧—缺氧—好氧)工艺对低碳城市污水中有机物的去除效率和脱氮、除磷的效率.结果表明:常规MLSS条件下,由于废水中
目前,在药物研发领域,识别新的药物靶点仍然是一个富有挑战性的问题。传统的药物靶点识别方法大部分着重于识别那些特定家族的“可药靶点”,却忽略了它们在生物学通路背景下的拓
miRNA是一种长约22nt的单链的内源性非编码RNA,它在真核生物中广泛存在。miRNA作为后转录调控的重要元件,它通过降解靶基因mRNA或者抑制其翻译成蛋白质影响其表达。人类基因组
本文首先介绍了研究背景,锁定研究内容为JPEG2000静态图像处理的核心算法,重点研究了离散小波变换的算法过程,提出将这一部分用可重构硬件实现的方法,并将这一硬件结构用于一
气候变化对陆地生态系统产生了深刻的影响,植物物候对气候变化高度敏感,因此,很多学者采用不同研究方法在不同区域开展了植物物候对气候变化响应的研究。我国在温性草原地区对主
海南坡鹿(Cervuseldihainanus)是我国特有的坡鹿亚种,历史上曾在海南岛(东经108°37’~111°03’,北纬18°10’~20°10’)广泛分布。到上世纪50年代,海南坡鹿的分布区主要集中在海