论文部分内容阅读
语音识别技术就是让机器能听懂人说话,并作出正确的反应从而执行相应的命令。语音识别技术作为一门交叉学科,它与声学、语音学、人工智能、数字信号处理、计算机学科等众多学科都有紧密联系。同时语音技术的应用逐渐成为一个具有竞争性的新兴高技术产业。近十年来,语音识别的产品也逐渐多起来,主要可以分为通用场合和专用场合两个方面。通用场合的识别率都比较低,一般都是大词汇量自然语流的语音识别,例如语音听写、语音短信、关键词检索、电话监控等。专用场合识别率都比较高,一般采用的词汇量小,部分采用孤立词识别,因此识别率大大提高,例如语音拨号、声控玩具、声控家电、语音点歌台、语音导航系统、语音股票系统、内线转接系统等。 本文就专有场合应用,对小词汇量,孤立词的识别,利用Nuance设计一个语音识别系统,具体的工作是: 1.介绍了语音识别的基本概念、孤立词语音识别的一般方法和特点。分析了语音识别的关键技术:特征提取技术、模式匹配准则及模型训练技术的基本原理。 2.分析Nuance涉及的关键技术:预处理、前端处理、识别搜索和自然语音理解,介绍Nuance的体系结构,并分析了一个典型的语音识别流程及其语法结构。 3.在系统实现上,利用WINDOWS下API函数进行采集音频数据,对初始化、采样格式和语音采集流程做了详细分析,实现了语音采集。并调用Windows Sockets DLL和WinSock API,通过UDP将语音数据实时传输到服务器。 4.在Nuance识别服务器端,分析Nuance的初始化、配置文件、语法结构和采集流程,实现接收来自客户端的语音数据、进行分析和识别处理,并将识别结果通过UDP实时传回到客户端。 5.此系统可以实现小词汇量识别,并成功地应用到安徽四创电子股份有限公司开发的应急指挥系统终端,实现语音控制代替手工拨号的功能。