汉语非特定人连续语音识别的研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:jackfang999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文对汉语非特定人连续语音识别的相关技术作了深入、系统的研究,并设计了面向任务的汉语非特定人连续语音识别系统,主要包括以下内容.(1)从系统设计的角度提出了语音识别系统的统一框架--统一层次模型,具有推进语音识别技术标准化的重要意义.(2)该文系统分析了音素建模对汉语语音识别的重要性,从语音识别的角度,结合现有国际音标体系、传统拼音方案等语音学知识,独立提出了包括50个单元的汉语音素扩展集合,建立了基于音素模型的汉语连续语音识别系统.(3)为了进一步提高音素模型对连续语音流的描述能力,该文对基于HMM的模型细化与共享技术作了系统研究.(4)对设计面向任务的连续语音识别系统中的关键问题(搜索策略、鲁棒性识别、端点检测、建模单元选择等)作了研究,比较了统计语言模型、规则语法模型对任务的描述能力和对语音识别搜索的不同约束能力,论述并实验验证了音节困惑度是衡量汉语语音识别任务难度的合理指标.(5)在语音识别新理论的探索方面,该文研究了统计学习理论在语音识别中的应用,尝试将支持向量机应用于汉语的非特定人数字识别,取得了优于HMM的识别性能,尤其显示出支持向量机在小样本学习下的优势,得到了一系列有价值的结论,并对支持向量机进一步应用于连续语音识别提出了展望.
其他文献
目前,套后成像测井技术是最新发展起来的套管井水泥胶结质量评价技术。该仪器结合超声兰姆波成像技术和超声脉冲回波技术,在测井过程中每秒会产生3.1M数据,而电缆传输速率现在一
学位
合成孔径雷达(SAR)是一种工作在微波波段的主动式遥感器,具有全天时、全天候的突出特征,在军事探测、灾害监测等领域具有重要的应用价值。ScanSAR作为SAR系统的重要成像模式之
期刊
随着通过Internet提供商业服务的发展,服务系统的可用性程度对服务提供者的商业利益具有重大的影响。同时,由于通过计算机服务系统提供的服务内容和服务范围都在不断扩大,计算机
期刊
据了解,黑色番茄原产自南美洲,因其果色和果实均为红黑色而得名。其果实药食兼用,具有浓郁的水果香味,酸甜适度的口感,营养价值高,特别适合鲜食。经医学界证明常吃黑番茄具有
造血干细胞作为最原始的造血干细胞,是临床应用和基础研究的优良材料之一,它是当前应用于细胞疗法最多的一类细胞,当把它注射到患有白血病、再生障碍性贫血、重症免疫缺陷症、地
期刊
期刊