汉语普通话声调评测算法研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:lichao984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声调在汉语中有着构词辨义的作用,声调的准确程度是判定普通话好坏的重要因素之一。因此,声调评测子系统也是计算机辅助语言学习(CALL)系统以及普通话水平测试(PSC)系统的重要组成部分。在连续语流中,因为当前音节受上下文内容的影响,所以声调中存在着不可忽视的变调和连续现象,对这种现象是否处理以及如何处理将对声调评测系统的性能产生很大的影响。本文考虑连续语音基频曲线中存在的各种超音段信息,对传统三音节声调轮廓特征的GMM模型进行特征的改进,以提高评测算法打分的准确度。本文主要研究成果如下。1.基频曲线的求取:传统基频曲线FO的求取,只得到了单个音节的基音频率,却忽略连续语流中两个音节之间声调的转换信息。本文考虑音节中辅音的基音频率可以代表前一音节与当前音节的声调转移特征,对三音节中的清辅音部分用Spline(?)(?)值法来拟合转移的声调曲线。实验表明,基于曲线插值拟合的GMM模型评测方法可以使测试集的机器打分和人工打分相关性可以达到0.7309。2.声调特征的选择:Fujisaki模型将基频曲线拆解成三个不同的元件函数,它们分别为短语元件:代表语句的语调信息;强调元件:反映每个音节的音调走势,即为声调信息;基底频率:代表了说话人的个性信息。根据上述理论,本文在Fujisaki模型的基础上去除语句的语调和说话人个性特征,只对基频曲线中的声调特征建模,结果显示,改进特征相比于传统特征,打分相似度在测试集中提高了14.09%。3.声调模型的改进:在验证声调转移特征对评测相关度的促进作用中,本文在Fujisaki模型的基础上分别对声调的核心段和特征转移段进行建模,实验结果表明基于频率转移特征的打分相关度比纯粹核心段特征的打分相关度要高。并且相较于2中Fujisaki模型在打分测试集中的相关度0.7361,基于声调核心段的评测相关度只有0.6137。这也说明了音节之间频率转移信息的描述提高了声调评测的准确度。
其他文献
基因微阵列(又称基因芯片)可应用对于不同发展阶段,不同人体组织,不同临床条件以及不同生物体等条件下的基因表达水平的测量。基因芯片的出现正在给生命科学研究、疾病诊断、新药
随着车联网在智能交通上的逐步应用,路车互联网作为车联网的一个重要分支,已经引起了国内外相关研究机构的高度重视。IEEE802.11p/1609系列协议作为路车互联网上的代表性协议,旨
人类进入信息社会,各种科学技术日新月异,使人们的生活方式、思想观念发生了巨大变化。其中网络技术和多媒体技术的发展使“千里眼”、“顺风耳”成为了现实,人们可以与千里之外
随着移动通信技术的快速发展,针对用户对业务带宽、传输时延等多方面的需求,新的移动通信系统就必须提供更快的传输速率、更稳定的传输过程和更小的传输时延。3GPP推出了新的演
近年来,多输入多输出技术(MIMO)由于能较大幅度地提高频谱效率成为无线通信领域研究的热点之一,而空时编码作为MIMO系统中的一项重要技术,引起了人们的广泛关注,它可以同时提供分
随着无线通信技术的飞速发展,无线通信业务的不断拓展使得有限的频谱资源变得越来越紧张,如何解决频谱分配与频谱利用之间的矛盾是无线通信领域重点关注的问题。认知无线电CR
随着人工智能需求的不断增加以及机器学习技术的飞速发展,语音交互技术俨然已经成为下一代智能家居等诸多应用领域的发展趋势。语音识别、说话人身份识别和语音情感识别等识
单载波频分复用接入(SC-FDMA)技术是一种在正交频分复用(OFDM)技术基础上发展而来的技术,它可以应用于无线高速数据传输系统中的上行链路。OFDM利用加入循环前缀的方法,可以消
图像超分辨率重建是指以多幅低分辨率图像利用某种算法重建一幅较清晰的高分辨率图像。它是在硬件、成像环境以及其他客观条件无法满足成像需求时,通过信号处理技术提高图像质
随着GPS技术的快速发展和广泛的应用,利用载波信号测量精确载体的姿态成为GPS应用中一个新的研究方向。本文通过载波相位测量相对定位理论,研究了基于短基线GPS航向测量技术的