基于音素的非特定人语音识别及其拒识算法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:gxwy1305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文工作主要围绕语音识别中两个既独立又相互有联系的领域:非特定人语音识别和语音拒识算法研究.该文结合非特定人语音识别系统的特点,提出了一种新的基于音素的非特定人英语语音识别算法,并在此算法基础上构建了一个非特定人英语命令词识别系统.系统的实现采用了隐马尔可夫模型工具包(HTK)与Visual C++两种工具混和使用,提高了整个系统的开发效率.在识别阶段针对词汇量大小采用不同的音素串匹配算法,在一定程度上提高了识别的质量.同时,该文采用话音活性检测(VAD)算法和自动增益控制(AGC)算法实现了在不同环境下的线语音识别,提高了该系统的实用性.语音拒识技术是从实验室转向实际应用的关键.该文首先研究了当前应用最为广泛的在线废料模型(Online Garbage Model)和反词模型(Anti-word Model)的算法,分析了它们的优缺点.然后在此基础上提出了一种新颖的基于置信度的非特定人语音识别拒识算法,该算法同时考虑了备选假设模型和多候选的信息,适用于拒识不正确的识别结果和词表外(OOV)语音.我们在一个非特定人英语命令词识别系统中作了一些相关的实验来评估这个算法的性能.实验结果表明,该算法可以有效的去除识别不可靠的语音,提高系统的识别率和稳健性,与基线系统相比,误识率下降了19﹪到23﹪.
其他文献
期刊
呼叫准入控制是WCDMA无线资源管理的重要方面之一,它与功率控制、分组调度、切换控制以及负载控制一起对提高系统资源利用率以及保证用户业务服务质量(QoS)起着关键作用.传统
该论文主要研究视频运动分析、视频分割和基于对象的编码,得到了国家自然科学基金项目(60072013)和南京邮电学院"图像处理与图像通信"江苏省重点实验室项目(K02091)的资助.主
期刊
期刊
无线通信中,提高带宽效率,在有限的信道带宽中传输更多的数据一直是个令人关注的问题。本文主要讨论在25kHz信道条件下建立一个具有高带宽效率和较好误码性能的无线数字传输系
近几年,随着通信技术和计算机技术的飞速发展,移动通信技术得到了突飞猛进的发展,人们一方面要求越来越多的话音业务和数据业务,另一方面又要求能够在任何时间、任何地点、用
为应对移动网络的扩容补点需求,4G系统引入家庭基站(Femto)来对室内网络覆盖进行补充。与传统蜂窝网相比,Femto部署方式更加灵活且成本低廉。不过, Femto的出现也使得基站节点间的
高频天波超视距雷达是一种可以探测位于超远距离的目标的雷达系统,具有监视范围大、单位面积成本低、防低空突袭,能探测隐身目标等突出优点。本文针对天波超视距雷达进行舰船目
所谓准入控制,是指对发生呼叫请求的业务,根据系统当前的负载信息,评估允许该呼叫接入后系统所付出的代价,从而决定是否允许该呼叫接入的一个功能模块.准入控制作为无线资源