湖南方言语音信号特征提取及辨识

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:djy0702
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
方言辨识是在已知一段发音所属语种的前提下,根据讲话者的发音判定其所属方言区域的一项技术,是非标准语音识别的基础,对语音识别技术的推广和应用有重要意义。目前相关的研究较少,此方面的研究不仅有利于提高方言语音识别系统的辨识率,而且对普通话评价、公安部门的刑事侦查等方面都有重要的价值。中国作为一个多民族多方言的大国,开展此方面的研究显得尤为必要。本文以湖南方言作为研究对象,对方言语音信号特征的提取、不同方言特征的差异及方言辨识中特征参量的合适选取进行了深入研究。针对语音信号具有很强的随机性而神经网络的输入结构相对固定等特点,提出了基于动态时间规整和神经网络的辨识方法,并对各种因素对辨识率的影响进行了分析。论文主要做了以下工作:1)分别提取了湖南长沙、株洲、湘潭和衡阳等四地方言的声学特征,包括共振峰、基音周期、LPCC系数和MFCC系数,对不同方言间所含的不同的特征信息进行深入的分析,发现不同方言在同一特征参数下表现出不同的特性,从而找到了对不同方言进行辨识的依据。2)将不同方言所提取的不同特征参数经时间规整网络分别规整为48维后,作为BP网络的输入,发现选取不同特征参数对不同类方言和不同声调方言所得到的系统辨识率不一样。选取基音周期作为特征参数时,系统的平均辨识率为79.2%左右,选取LPCC系数作为特征参数时,系统的平均辨识率达到84.2%,选取MFCC系数作为特征参数时,系统平均辨识率可达到86.3%。3)对本文所提出的基于动态时间规整和神经网络的方言辨识系统的性能进行了分析,讨论了规整维数和隐含层神经元个数对系统辨识率的影响,实验结果表明:将输入参数规整为48维的辨识率要稍高于规整为36维的辨识率;隐含层神经元个数在10个时,辨识系统可以达到较好的效果。
其他文献
志愿服务已经成为推动社会全面发展的重要手段,成为社会文明进步的重要标志,成为一项国际性的、蓬勃发展的事业。伴随着志愿服务的发展,志愿事业所显现出来的问题也不断增多。而
高峰功率、短脉冲的中红外光源(3-10μm)是科学研究领域的重要工具和手段,它可以研究从半导体纳米结构到蛋白质结构众多物质的时间分辨光谱;由于量子级联激光器和量子喷泉激光
优先购买权从性质上来说,应定性为"形成权",即权利人一旦行使,无须出卖人同意就在他们之间形成以出卖人与第三人订立的合同为内容的买卖合同关系。一般地说,优先购买权既可以
目的:探讨在我国文化背景下,锻炼目标内容对青少年体育锻炼和主观活力的影响及其心理机制。方法:采用锻炼目标内容量表、锻炼基本心理需要量表、Godin业余锻炼量表和主观活力
目的:总结先天性唇腭裂患儿围手术期的护理体会。方法:分析127例先天性唇腭裂患儿修复术的临床资料和术前术后护理方法。结果:127例唇腭裂畸形均一次修复成功。结论:术前全面贯彻
我国创新驱动发展战略实施面临着重大机遇,将该系统战略工程落到实处迫在眉睫。从创新生态系统的视角来看,以创新驱动发展战略实施面临的障碍为切入点,聚焦战略实施中的知识
探讨了非正弦交流电路真功率团数的计算方法及其实际意义,最后列举一实例介绍了其在电源设备检测中的具体应用。
<正>叮铃铃,叮铃铃,上课铃声响了。今天我们要开展一个辩论赛,辩论赛的题目是诚信与善意的谎言。首先由诚信代表发言:"诚信是做人的基本原则,丢了诚信,你就是一个不完美的人
期刊
为了探究高技术产业技术创新、制度创新与产业高端化的协同发展关系,在理论分析基础上构建了复合系统协同度模型,运用2000-2012年数据对我国高技术产业技术创新、制度创新与
思想政治工作是我们党的优良传统和政治优势,不仅历史悠久,而且意义深远。党领导中国革命和建设的长期历史经验,无不反复证明着这样一条基本的规律:哪里有出色的思想政治工作,哪里