基于DTW和HMM的语音识别算法仿真及软件设计

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zp283106190
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在进行水下语音通信时,采用语音识别与合成技术对语音信号进行信源编码和解码,可以极大的减少语音编码后的数据量,从而大幅度降低水下语音传输时对速率的要求。语音识别技术是这种低码率水下语音通信方案发射端的关键技术。为了给这种水下语音通信方案提供一种灵活、高效的语音识别方法,本文系统地研究了组成小词汇量语音识别系统的各种常用技术,并在此基础上编写了一个小词汇量孤立词语音识别软件。论文主要完成了以下五个方面的工作:(1)介绍了语音识别系统中涉及到的基本概念及原理,包括语音信号的预处理、特征参数提取、模式匹配及模型训练等技术。(2)建立了一个包括语音文件和录音信息的数字语音数据库。(3)用MATLAB语言实现了端点检测算法,LPC、LPCC、MFCC三种特征提取算法及DTW、HMM两种模式识别算法,并进行了仿真实验。(4)编写了基于Windows操作系统的小词汇量孤立词语音识别软件,该软件所涉及到的算法全部用C语言实现。(5)对于识别系统各个关键参数的不同取值进行大量实验并统计识别率,讨论各个关键参数对系统识别率的影响,并进行分析。
其他文献
【正】庞善起,1965年出生,河南卫辉人,理学博士,1989年至今在河南师范大学任教,现任数学与信息科学学院副院长,硕士生导师,民盟河南省委委员、常委,政协河南省委常委。目前任
【正】大学生是国家宝贵的人才资源,是民族的希望和祖国的未来;大学生思想政治教育关系中华民族的整体素质,关系国家的前途和命运。因此,中共中央、国务院发出的《关于进一步
阅读教学是小学语文教学的重要组成部分。但是传统的小学语文阅读教学中教师一味讲解、剖析的教学模式,扼杀了学生的阅读兴趣,阅读理解只停留在肤浅的层面,阻碍了学生阅读能
二醚化合物是Ziegler-Natta(Z-N)催化剂的一类新的给电子体,以9,9—双(甲氧基甲基)芴(DMMF)这种二醚化合物为外给电子体(De)或内给电子体(Di)的Z-N催化剂催化丙烯聚合时,效果
【正】一、市场行情简述本月行情:5月国内TDI市场继4月末拉涨后高位盘整至月末再次小幅拉涨。5月国内TDI市场继4月末拉涨后高位盘整至月末再次小幅拉涨,5月市场的整体高位主
朗香教堂尚不足以构成柯布西耶晚年建筑的全部体系,但变化却是肯定的。这种变化超出了形式范围。在其随后不多的作品中,朗香教堂中用光的影响随处可见。本文试图将朗香教堂的
中小企业是经济发展的主力军和加速器。了解中小企业融资缺口,解决中小企业融资难题是目前我国面临的严峻问题,是我国市场经济持续、快速、健康发展的重要保障。目前理论界对
【正】一、市场行情简述本月行情:5月,国内硬泡聚醚市场行情震荡下行后持稳。月初市场在成本面利好支撑明显下,行情间歇性上扬,而下游需求无明显提升,且杀跌抄底心态明显,刚
采用水解-接触氧化-气浮-混凝沉淀-生物炭工艺处理以分散染料为主的印染废水,设计规模为960 m3/d,进水水质为:pH 8.01,CODCr992 mg/L,BOD5 251 mg/L,SS 298 mg/L,色度400倍;