利用声调判别提高汉语数码语音识别性能

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:adonis77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数码语音“2”与“8”等的混淆是汉语数码语音识别错误的主要来源。为此,提出了在汉语数码语音识别中引入声调判别的方法。首先设计了变长度短时平均幅度差函数(LVAMDF)、元音中心定位、基音谐波单周期校正以及基音邻近搜索等一系列高性能基音周期估计算法,在此基础上设计了一个针对汉语数码语音声调识别的MDTD算法。实验表明,新的基音周期估计方法和MDTD算法使汉语数码语音识别率由95.2%上升到98.5%,更使“2”与“8”的分辨率由90.5%上升到了98.8%,从而较好地解决了这个难题。 The confusion of digital voice “2” and “8” is the main source of Chinese digital voice recognition errors. For this reason, a method of introducing tone discrimination into Chinese digital speech recognition is proposed. Firstly, a series of high-performance pitch estimation algorithms such as LVAMDF, vowel center localization, pitch harmonic single-cycle correction and pitch-neighbor search are designed. Based on this, Speech Tone Recognition MDTD Algorithm. Experiments show that the new pitch period estimation method and MDTD algorithm increase the recognition rate of Chinese digital speech from 95.2% to 98.5%, and further increase the resolution of “2” and “8” from 90.5% to 98 .8%, so as to better solve this problem.
其他文献
X射线衍射仪已成为材料行业用的常规大型精密仪器之一,具有效率高、寿命长、应用广泛等特点,其电子线路复杂,所用元件集成度很高,设备的故障及其原因诊断和维修的难度很大,所以设
会议
黄土矿物组成是研究黄土来源和成因的重要手段.利用X射线衍射(XRD)对亚洲内陆塔吉克斯坦共和国的黄土进行了矿物组成特征分析,并与黄土高原和新疆伊犁黄土进行了对比.研究结
β-glucosidases that belong to the glycoside hydrolases catalyze the hydrolysis of glucosidic linkage between two carbohydrate moieties or a carbohydrate moiety
会议
叶锦添1965年生于香港,职业为美术设计、造型设计和服装设计。毕业于香港理工学院高级摄影专业的他,长期跨领域发展,涉足影视、舞蹈、戏剧、装置艺术、文学写作等。在影视方
会议
会议
随着信息技术的发展,武器设备信息化水平的提高和信息化状况下的战争的必要性,武器设备支援信息化成为今后设备支援的必然趋势,也引起了加强武器设备支援的信息革命.人们对这
本文主要针对生态修复技术在河道整治中的作用进行分析,介绍了目前的河道治理现状,探讨了河道污染的产生原因,并针对各类生态修复技术进行具体阐述,希望能够为相关工作人员起