论文部分内容阅读
随着普通话使用的普及,少数民族有越来越多的人在学习普通话,但是由于发音差异,少数民族很难将普通话的发音读准确。但是目前,对于少数民族普通话习得只是给出数据或是图表的形式说明研究结果,不能对普通话习得者的发音特征给出具体的建议,没有针对藏语普通话发音者的声调检测系统,使得用户很难针对偏误结果而改正自己的发音方式,从而提高发音。本文从汉语普通话习得方面进行研究,设计一个少数民族普通话习得声调偏误检测系统,通过对实时录入的少数民族普通话发音进行分析,最终实现了少数民族普通话习得单字调、双字调声调偏误检测,并给出具体分析。该系统得到了少数民族普通话习得声调通过人机交互界面显示说话人发音偏误表现,并给出具体建议,纠正其发音的偏差,以提高普通话习得者对汉语普通话声调发音的准确性。本文的工作和创新点是:1.采用了对数频谱距离的端点检测算法。本文在检测系统中运用对数频谱距离的端点检测算法来获取实时录音有效话帧,该算法可以有效地去除录音时多余的静音和噪音成分。端点检测算法中的VAD函数是该算法中的主要函数,对有效话帧和噪声做不同的处理。2.采用了STRAIGHT算法提取语音特征参数。自适应加权谱内插(Speech Transformation and Representation based on Adaptive Interpolation of weighted spectrogram,STRAIGHT)是一种常用的语音基频值提取算法,本文在检测系统程序中利用STRAIGHT算法对用户录入的发音进行参数提取。3.采用了欧式距离算法计算数据之间的距离。本文在检测系统中通过欧式距离算法计算当前用户发音五度值曲线与标准普通话五度值曲线之间的距离,系统以此为参考阈值,给出检测结果的表情显示和对应的发音分数等。4.采用了GUI人机交互界面对偏误结果进行反馈。本文提出了以GUI人机交互界面的形式来显示偏误分析结果,用户可以从多种形式中得到反馈结果。用户可以根据系统提示自行选择测试的声调,并录入自己的语音,系统进行内部处理,最终以图示,表情,打分的形式给出反馈结果。用户可以看到自己与标准普通话的发音偏误,并在系统建议下进行二次发音测试。