基于机器学习的多特征融合汉语声调识别算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户：zxy6651

【摘要】

：

【作者】

：

李濛

【机构】

：

山东大学

【出处】

：

山东大学

【发表日期】

：

2021年期

【关键词】

：

声调识别

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语言是人类最重要的、最常用的和最便捷的通信方式，汉语是一种具有声调的语言，声调体现为人在发音时语音起伏的变化，在人们的日常交流中具有辨别语义的作用。声调识别是对汉语音节的声调变化模式进行四分类或多分类的典型识别问题，在汉语的人机语音交流和听障患者语言训练系统中均有重要应用，因此，语音信号声调识别是一个有意义的研究课题。声调识别的研究分为特征参数和声调分类器两方面，为了提高声调识别系统的准确率、鲁棒性和响应速度等性能，特征参数应具有可区分度高、计算复杂度低、物理含义明确等特点，同时，声调分类器也应具有分类能力强、抗干扰性好、运行高效等优势。
　　本文的研究从以上两个方面入手，首先对基频参数和七种典型特征参数集进行了介绍，并通过实验证明了倒谱参数并不适合用作声调识别特征参数;其次介绍了五种在分类问题中广泛应用的机器学习模型，并将它们作为声调分类器在七种典型特征参数集上进行了预对比实验;接下来由此提出了一种基于特征融合和随机森林的汉语声调识别算法，在算法中首先对七种典型特征参数集采用三种融合方法进行了特征参数融合优化，在优化出的三个融合参数集上分别构建决策树进而组成随机森林，然后在多人的汉语普通话单音节样本数据集上进行了模型参数优化实验、性能指标对比实验和小样本训练集对比实验，并将得到的结果与其他四种声调分类器做对比。
　　实验结果表明:①五种声调分类器可以通过使用不同的融合参数集达到最好的声调识别效果，说明使用不同的分类器进行声调识别时需要根据模型特点具体确定使用的特征参数。②实验结果中三个融合参数集的最优声调识别准确率均在97.50％以上，说明使用的三个融合参数集均能很好地对四种声调进行区分，而且在融合参数集S2和S3中使用的两种特征优化方法也较好地选出了对于声调识别可区分度高的特征参数。③基于特征融合和随机森林的汉语声调识别算法表现出优异的声调识别性能。随机森林在三个融合参数集中的声调识别准确率、模型泛化指标(AUROC)和不平衡数据分类指标(AUPRC)的值始终维持在97.50％以上，其中，使用全特征融合参数集S1的随机森林的三个性能指标值均高于98.32％，在小样本训练集中，随机森林使用三个融合参数集的声调识别准确率也都维持在93.57％以上，说明随机森林是一种识别准确率高、泛化能力强且稳定性好的声调分类器，对类似分类问题有借鉴参考价值。
　　

其他文献

掺混臭氧对甲烷/氧气（或空气）预混合气体燃烧特性的影响

学位

弧形障碍物对氢-空气预混气爆轰特性的影响

学位

环形管道内缓燃向爆轰转捩过程的实验和数值研究

学位

COB光源翅片散热器传热优化研究

COB光源在工业生产、生活照明等相关领域已经得到相当广泛的应用,而结点温度是影响其性能及寿命的重要因素,COB光源的正常运行离不开有效的热管理。在形式多样的热管理方式中,应用翅片散热器对COB光源进行自然对流散热是一种廉价高效的散热方式,但其散热性能与COB光源产热量间通常存在不相匹配的问题从而容易造成散热成本投入过高或不足的问题。针对COB光源翅片散热器存在的问题,本文采用理论计算分析、数值模拟

学位

基于红外技术的弯管冲蚀无损检测与管道缺陷内边界识别

学位

葡萄糖酸钙真空蒸发冷却结晶过程研究

葡萄糖酸钙是一种在医药、食品、材料和化工等领域有着十分重要应用的化工产品,其结晶过程影响着产品的产量、质量、效益等方面。然而,截止目前,有关葡萄糖酸钙结晶理论的研究却鲜有报道,致葡萄糖酸钙规模化生产缺少基础理论支持,产品生产效率低,因而开展葡萄糖酸钙结晶机理的研究具有重要的理论意义与应用价值。本文从结晶热力学、结晶动力学和结晶工艺三方面对葡萄糖酸钙真空蒸发冷却结晶过程进行了研究。首先,采用EDTA

学位

侧风下进风预喷淋对自然通风空冷塔冷却性能的调控机制与策略研究

进风预喷淋可提升自然通风空冷塔在高温时段的冷却性能,但环境侧风会改变自然通风空冷塔内部及其周围的空气动力场,研究适应环境侧风的进风预喷淋系统对进一步提升空冷塔的冷却性能具有重要意义。本文重点考虑侧风的影响,探究进风预喷淋对自然通风空冷塔冷却性能的调控机制与策略。首先,基于气液两相传热传质过程的理论分析,建立了双喷嘴水平喷淋蒸发过程的三维数值仿真模型,对喷淋蒸发过程中的传热传质进行了耦合计算,并综合

学位

基于火电厂热力设备特征的大数据应用技术研究

电厂热力设备众多、系统复杂、工况复杂,产生了巨大规模的运行数据,运行过程中整体系统与各个设备间紧密联系,如何将这些数据合理的分析处理是进一步推动电厂实现数字化、智能化发展的关键。近年来大数据技术蓬勃发展,已经应用到很多领域包括电力行业。大数据技术以其高响应速度、高处理速度的优势,对电厂热力设备运行数据的分析提供了便利。国内外研究人员对大数据技术在电厂的应用进行了一些探索和试验。他们利用大数据技术探

学位

α--Fe2O3脱硝催化剂改性、抗硫及碱金属中毒理论研究

氮氧化物作为一种常见的大气污染物,严重危害人体健康与生态环境,日益受到国家环保部的重视。NH3-SCR控制技术是我国燃煤电厂烟气脱硝的主流技术,其技术核心为催化剂。目前应用最为广泛的商用钒钛系催化剂存在反应温度高、二次污染、成本高等缺点,因此寻找环境友好、成本低廉、脱硝性能优异的催化剂成为研究热点。铁基催化剂由于具有上述优势而受到广泛关注。本文应用密度泛函理论,从分子尺度探究Mn、Ti、Cr、Ni

学位

换热器CAD系统的研制与开发

该论文专门针对最为常用的"固定管板式换热器"、"浮头式换势器"和"U型管式换热器"的设计,以Visual C++5.0为工具,开发了换热器CAD软件系统.该文设计并建立了独立、开放、数据共享、运行可靠的材料性能数据库、标准零部件数据库和设备材料数据库,并实现了这些数据库的动态查询;实现了标准中大量的数据图表的计算机自动查取;利用面得对象的软件开发技术编程,使软件易于维护,便于扩充.软件能够实现三

学位

换热器

基于机器学习的多特征融合汉语声调识别算法研究

与本文相关的学术论文