多维语音特征参数可视化及在语音识别研究中的应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:HalfHour
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据及电子商务的快速发展,多维数据呈爆炸性增长,这为多维可视化技术的发展带来了新的挑战和机遇。近年来,多维可视化技术取得了较大的发展,广泛应用于各个领域。多维可视化技术也可应用于语音领域,但传统的多维可视化方法不能直观地显示多维语音特征数据,很难满足人们对多维语音特征参数可视化的需求。为了更好地研究说话人识别和语音识别中存在的各种问题,本文研究了一种新的多维可视化方法,该方法可以直观地显示多维语音特征参数。本文的主要研究内容如下:(1)研究了多维可视化技术,阐述了多维可视化技术中存在的问题,详细介绍了现有多维可视化技术的基本原理及优缺点。并提出了一种新的多维可视化方法,该方法以三维数据可视化为基础,采用逐维展开法,分层次显示数据,可以得到较好的可视化结果。(2)说话人识别中的多维语音特征可视化研究。首先介绍了语音信号多维特征可视化的主要步骤;然后进行了说话人识别实验,研究了端点检测对说话人识别率的影响,并应用多维可视化方法分析了端点检测能提高识别率的原因;最后通过多维可视化的方法证明了说话人识别中,测试样本和训练样本的分布要保持一致,否则严重影响识别性能。(3)语音识别中的多维语音特征可视化研究。介绍了语音识别技术的基本原理;通过对单个汉字建立模型,进行语音识别实验,研究了阶数对识别率的影响,同时应用多维可视化分析了阶数对识别率产生影响的原因;最后对语音识别中易误识的汉语音素进行多维可视化研究,分析了识别错误的原因。实验结果表明,音素在语音识别中有至关重要的作用,通过对音素进行可视化分析,发现汉语元音部分相同或相似时,语音理论模型的分布就大致相同。元音部分对理论模型的贡献很大,当包含相同或相似的元音时,容易发生误识。
其他文献
土石混合体介质广泛的分布在边坡工程、地下工程、土石坝工程、公路工程等基础设施建设项目中,并且往往对工程体的稳定性具有极其重要的影响。土石混合体常常具有松散不均,富
目标检测是图像处理、计算机视觉领域备受关注的研究热点,也是多目标跟踪、目标识别等课题的基础。在过去几年的时间里,随着卷积神经网络的发展,图像目标检测研究取得了长足
随着近些年来高速铁路的蓬勃发展,高速铁路网逐渐建成并完善,高速铁路也成为人们中远距离出行的首选交通方式。但在运营过程中高速铁路列车受到随机因素干扰时,造成列车不同
高寒山地区域空袭与反空袭对抗是我国内陆边境的主要作战样式之一,研究该作战地域的防空火力部署具有重大的军事意义与应用价值。鉴于该方面研究相对滞后以及防空作战急需的
随着“全球一体化”建设的不断推进与发展,各国的来往交流的需求不断增加。不仅体现在人员的流动,还包括货物的流通。民航运输因其有着独特的便利性而得到很大的发展,各国的
真空发生器在气动行业应用于真空输送过程中,可以快速的产生负压,实现短距离负压输送,本文结合真空发生器在现代工业上的应用,通过数值模拟的方法,探讨了包括真空发生器结构
脱氧核糖核酸(Deoxyribonucleic acid,DNA)是生物体的主要遗传物质,由脱氧核糖及四种含氮碱基组成。UV照射、X射线、病毒、药物等的刺激可以使DNA发生损伤,出现替换、删除、
航空发动机建模仿真技术在发动机全寿命周期内各个阶段都有所应用,实现准确的发动机建模仿真对于发动机的状态监控、性能分析及新型航空发动机研制等都意义重大。本文采用面
公司价值是衡量公司为股东创造收益能力的最直接指标,它能够客观真实地反映公司在某个期间的经营成果。公司价值会受到公司资本结构、公司治理以及行业环境等多方面因素的影
滨海地区服役的钢筋混凝土结构由于长期受到氯离子的侵蚀,结构的抗震性能严重退化,目前常用的结构加固技术(Structural strengthening technology,SS)不能阻止结构内钢筋的进