汉语CALL系统韵律诊断关键技术的研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:luorui2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语的韵律自动诊断是计算机辅助语言学习系统和口语自动评测系统中的重要核心技术之一。本文根据实际系统的需要,在深入分析当前主流韵律评估技术的基础上面,针对汉语普通话学习过程中韵律诊断关键问题,包括重音、声调、语调的诊断进行了深入的探讨和分析。本文对该领域主要的贡献和创新点有:   1.本文提出了基于超音段多特征融合的重音诊断方法,采用重音特征包含音高、时长、短时能量、基于TEO算子的子带能量以及基于状态拼接的PLP特征,同时融入了句子间重音的相对性。研究结果表明不同重音声学关联特征有效性按主次分为:时长、子带能量、音高、短时能量、PLP特征。同时,提出分声调建模的方法,来提升重音诊断的性能,建立了一套行之有效的重音诊断方案。   2.本文首次提出了基于主导集的单字声调聚类的诊断方法,用于重口音条件下声调的诊断。该方法适合特定应用背景,在实际的数据集合上面声调诊断的相关性水平达到了人与人之间相关性。同时,该方法能自动确定类别的个数,用于单字声调诊断,可以提供主要的声调错误并提供调型曲线作为信息反馈。与基于K-means声调聚类检错方法相比,能有效提高声调检错性能。   3.针对带重口音下连续语音的声调诊断,本文首次提出了基于聚类的连续声调诊断框架,形成了完整的声调诊断体系和技术框架。进行了多层面连续语音声调聚类诊断方法的研究,分别建立了基于Unitone、Bitone、Tritone及其分词融合的声调聚类诊断方法。为了解决Tritone数据稀疏的问题,本文首次提出了基于决策树的声调聚类诊断方法。实验表明:基于决策树的声调聚类诊断有效的提高声调错误诊断的性能,同时能够提供精细的声调反馈信息。   4.针对汉语计算机辅助语言学习系统中的陈述、疑问、感叹、祈使四种语调的识别和诊断进行了全面深入的研究和分析,本文采用基于超音段特征融合的语调识别和诊断方法,进行了基本特征音高、音长、音强以及高层韵律特征包括停顿、起伏度、重音、调型等韵律特征参数的分析和研究,同时采用SFFS特征选择的方案提升系统的性能。实验验证了该方法的可行性和有效性,获得了较优的结果。研究结果表明,在语调识别和诊断中特征的重要程度为:音高、音长、能量、停顿、重音、起伏度、调型。
其他文献
旋翼无人机具有独特的飞行性能和独有的低成本、低损耗、零伤亡、战场生存能力强、可重复使用以及高机动等诸多优势,在军用及民用方面具有广泛的应用前景。开展无人机自主环
本文主要研究对象为两类空调控制系统,一个是基于西门子PLC可编程控制器的控制网络系统,该系统采用西门子S7-300PLC做主站,S7-200PLC做从站,PROFIBUS组网的主从式分布,通过软硬件
航天型号具有技术难度大、投入资金多、质量与可靠性要求高、研制协作面广及研制风险高等特点,科学有效的管理是航天型号成功的根本保障。随着我国航天型号研制形势发生任务急
伴随着我国低空空域的逐步开放,通用航空产业将迎来迅猛发展,而传统的飞行训练方法高度依赖教练机与飞行教练,难以满足突如其来的巨大需求。传统的飞行训练模拟器能够模拟飞
近年来,垃圾短信严重的影响了人们的生活。随着微博的出现,垃圾信息存在进一步泛滥的风险。由于短信、微博等短文本的特殊性以及已有的特殊突围方法,传统文本过滤方法效果不佳。
多机器人系统无论在工作范围、时间和效率等方面都具有单体机器人系统无法比拟的优势。多机器人系统的最大特点在于:通过适当的协调协作机制,使得多个单体机器人系统能够同步
人脸识别是模式识别与计算机视觉领域的热点研究内容,在个人身份认证与识别、安检、智能人机交互等领域有着广泛的应用前景。现有的人脸识别算法深受低分辨率、异质图像模态
自主水下机器人(UUV,Unmanned Underwater Vehicle)作为一个费用低、可以替代人或可以遥控的系统已经得到了广泛的应用,如在海洋开发、军事活动等领域发挥的重要作用。但随着
傅里叶变换红外光谱技术由于具有快速、整体和无损鉴定复杂混合物体系等优点,已被广泛应用于石油化工、食品工业、制药工业和生物等相关领域。然而,采集得到的红外谱图常常易
运动想象能够与实际运动一样激活运动相关脑皮层,促进其重组或重建,因而被用于脑损伤肢体瘫痪患者的康复训练治疗。但因许多患者难于准确完成运动想象训练任务,且目前利用脑机接