基于HTK的汉语数码语音识别研究

被引量 : 0次 | 上传用户:gyqg1q
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与信息技术的持续发展,语音交互必将成为人机交互的必要手段。语音识别技术经过了近半个世纪的发展,目前已日趋成熟,并得到广泛的应用,但还远不能说完美得没有任何值得研究、值得改进的地方。就算初看起来很简单的汉语数码语音识别,虽然它已经在电话自动拨号、家电产品的遥控、工业控制等领域中开始发挥作用,但是仍然有很大的深入研究空间,以提高识别系统的速度、稳健性和识别率。本文结合隐马尔可夫模型原理,用MATLAB语言编程实现了汉语离散数码语音识别系统;并利用HTK(HMM ToolKit)语音处理工具箱,实现了汉语离散数码和汉语连续数字语音识别系统。首先,本文介绍了语音识别技术的国内外发展状况,分析了汉语数码,特别是汉语连续数字语音识别中面临的困难,在此基础上阐明了本课题的研究背景和意义。其次,详细讨论了语音识别系统的基本原理构成模型,介绍了语音信号的数学模型、预处理和特征参数提取等过程,确定了MFCC参数作为识别参数。并讨论了本文语音识别系统采用的隐马尔可夫模型(Hidden Markov Model,HMM),介绍了HMM的定义,三个基本问题以及基本算法等问题。着重讨论了HMM在实际应用中的一些具体问题,通过实验确定了汉语数码语音识别系统的最佳状态数及混合度数。接着,简单介绍HTK的软件结构及HTK工具包,着重讨论了基于HTK的语音识别系统的搭建过程,通过汉语离散数码,以及连续数字语音识别系统证明识别单元、高斯混合分量的数目,MFCC维数的适当组合可提高系统的正确识别率。最后对汉语数字语音识别系统的总结及今后工作的展望。
其他文献
《时尚》杂志的兴起在中国是近二十年的事情,它典型的反映了传媒与时尚之间的互动关系。《时尚》杂志的时尚性、高端性、针对性特征凸显了所有时尚类杂志的特点。《时尚》杂
生态马克思主义理论是由西方马克思主义者倡导的一股思潮,是西方马克思主义对当代全球问题和人类发展困境的哲学思考。在发达工业社会,不仅人与人之间关系异化,人与自然之间
【正】 “每,虽也”《小雅·常棣》“每有良朋,况也永叹”,郑玄笺:“每有,虽也。良,善也。当急难之时,虽有善同门来兹对之长叹而已。”笺语“虽有善同门”即经文“每有良
随着移动视频广告市场的发展,AR广告的价值不断被肯定,并且成为备受青睐的宣传方式。虽然市场上出现了很多与AR技术结合的广告,但仍存在重技术忽视内容的现象。文章从可供性
加强医疗设备、医用耗材采购管理工作,规范设备的使用管理,不仅有利于降低医疗管理成本,减轻患者负担,还能保障人体使用医疗器械的安全和有效。我院根据《医疗器械监督管理条例》
思想政治教育是人类发展的风向标和导航仪,是一个国家、一个民族、一个企业的核心价值观体现和引领力量,透过思想政治教育往往能看清其潜藏的文化底蕴。对于国有企业而言,坚
较强的抽象性与逻辑性,是数学课程的基本特点,对于学生综合能力的要求较高,因此在学习当中可能会遇到较大的困难。在新课程改革背景下,教师应该致力于高效课堂的构建,促进小
本课题以原代培养的BALB/c小鼠脾脏淋巴细胞为靶点,通过小鼠体内、外模型,筛选出具有细胞免疫抑制作用的溪黄草有效成分并对有效成分的免疫抑制机理进行研究。研究结果表明,
滤波器在射频、微波电路中发挥着重要作用。不断出现的无线通讯系统应用对滤波器设计提出了前所未有的挑战:更高的性能指标、更小的尺寸重量、更低的成本已成为新型滤波器必
近年来,随着旅游业的迅速发展,旅游房地产逐渐成为新的投资热点。虽然旅游房地产带来巨大的经济效益和社会效益,但在我国其项目开发还处于探索阶段,理论基础、开发模式和法律