基于语音特征分析的汉语方言辨识研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:ssm3695
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语方言辨识是在已知一段语音所属方言区域的前提下,判断未知语音所属方言区域的一项技术,在公安刑侦工作和语音识别技术的推广和应用中有着重要意义,已越来越受到相关领域研究人员的重视。方言辨识系统性能好坏取决于语音信号特征的提取,合理地选择特征参数对方言辨识系统的识别率有很大的提高。因此,本论文围绕汉语方言的语音特征进行了相关研究,主要的研究工作及其成果如下:1.提出了一种Mel频率倒谱系数和滑动差分倒谱系数组合的方言辨识方法。首先为了使滑动差分倒谱系数的性能达到最优,研究了针对普通话、上海话、广东话、闽南话、陕西话、四川话、东北话和长沙话八种方言的滑动差分倒谱的最佳参数组合。然后提取其MFCC和滑动差分倒谱系数两组特征参数作为支持向量机的输入来进行辨识。仿真实验结果表明,基于MFCC和滑动差分倒谱系数组合的方言辨识的识别率高达90%。2.提出了一种S变换和奇异值分解的方言辨识。研究了语音信号的短时傅里叶变换、小波变换和S变换三种时频分析方法,仿真实验结果显示S变换得到的时频分布图具有更高的分辨率。由于时频分布图的维数过高且包含无用值,本文采用了奇异值分解方法对其降维,并用支持向量机进行方言辨识,仿真实验与短时傅里叶变换和小波变换两种时频分析方法的方言识别进行比较,结果表明S变换和奇异值分解的方言识别率高达85%。3.采用了基于线性鉴别分析和GA-LBG码本设计的汉语方言辨识方法。高维的语音信号意味着高的计算复杂度,且包含冗余信息,不利于识别,因此采用线性鉴别分析进行降维,提取更高效的特征。本文首先用线性鉴别分析对普通话、上海话、广东话、闽南话、陕西话、四川话、东北话和长沙话八种方言进行降维,然后采用遗传算法和LBG算法设计矢量量化的码本,最后通过失真测量进行汉语方言辨识。
其他文献
本文着重描写河源市源城区本地话句式特点,分别介绍了本地话被动句、处置句、选择问句、其他带标记词句式等八种常见又具有特色的句式。运用三个平面的理论,在分析每种句式时
在旅游业中生成的旅游展演艺术,是各种地方性文化旅游中文化变迁的表征,目前学界主要在旅游人类学和民族文化学视野对其进行阐释。无论其作为“传统”文化还是“发明”的“传统
为庆祝中国共产党成立90周年,今年“七一”前后,各广播电台、电视台将围绕这一主题,制作和播放一系列的相关节目。梳理广播电视“七一”宣传的历史脉络,总结其中的基本规律,
众所周知,按照有关规定,婴幼儿童乘坐公共交通是按照身高收取相应的费用的,或免票,或半票,或全票,但这一惠民政策在具体落实中却走了样——个别司乘人员该给乘客免票的不给免票,该买
报纸
随着人民群众物质生活水平的提高和旅游业的快速发展,近年来,中医药旅游作为一种全新的旅游产品孕育而生,业界对其研究也在不断深入。为全面了解我国中医药旅游的研究成果与
大脑作为人体最复杂的器官,具有强大的功能。通过脑科学的研究可以认识大脑,揭秘脑功能的本质并对相关脑疾病进行诊断、治疗及预防;同时可以通过人工智能创造大脑从而激发大
这些年来,随着遥感技术的发展,SAR图像在很多领域得到了广泛的应用,SAR图像处理的基础是SAR图像分割,然而由于SAR图像成像的特殊性,其极不匀质区域一直是分割的难点。目前有
本文运用新凯恩斯的动态随机一般均衡模型(DSGE),引入金融加速器机制,研究在不同的宏观经济外部冲击下,中央银行分别运用传统的货币政策工具、加强的货币政策工具以及加强的
为了解内科护士核心能力现状,探讨其影响因素,整群抽取辽宁省5所三级甲等医院内科护士549名,对其进行问卷调查,通过f检验、方差分析、多元线性回归分析其影响因素,为制定针对性培
随着循环神经网络的出现,自然语言处理的任务命名实体识别、自动问答、机器翻译、文本蕴含识别等都取得了不错的效果。文本蕴含识别和阅读理解属于自然语言理解范畴,阅读理解作为自然语言处理任务中最难的一个任务之一,可以应用在自动问答和智能搜索上。随着阅读理解语料SQuAD和TriviaQA web的出现,使得阅读理解在神经网络中的研究成为了可能。LSTM作为文本提取特征的首选模型,推动了自然语言任务的发展。