基于HTK的计算机辅助田野调查系统研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:login_action
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国是个多民族、多语种的国家,语言研究面临十分繁重的任务。近些年越来越多的计算机软件开发用于语言的田野调查,大大提高了调查的效率。然而在计算机软件在完成录音工作后,记音和校对环节还停留在人工听辨的阶段。由于田野调查语料数量庞大,记音工作繁重,难以保持标准的一致,从而产生人为原因的谬误,且目前尚无更加有效的办法缩减记音的工作量。本文针对这个问题进行了基于HTK的单音节识别研究,通过对现有田野调查语料的单音节录音文件进行特征分析、预处理、提取MFCC特征参数,从而建立每个音对应的HMM模型,利用HTK工具包对语音特征进行提取,从而实现语音声学模型的训练,最后进行识别性能测试。本文对田野调查的语料进行了收集和预处理,合并了不同语言中的相同发音,并且针对MFCC维数、HMM状态数及GMM个数这三个参数对跨语言的混合材料中单音节的识别率进行研究。实验表明:对于包含了方言和民族语多种语言混合的单音节语音材料,在单个用于训练的独立语音数据量充足的情况下,识别率可以达到80%左右。并且增加HMM状态数和GMM个数有利于识别率的提高,但是超过一定的值后,识别率会有所下降。对于非特定人的单音识别来说,单个语音的识别率和其训练量成正比。在语音数据量充足的情况下,能得到较为理想的识别率。
其他文献
近年来,随着语言学研究的不断深入,尤其是功能语言学、语义学、语用学的蓬勃发展,语言中的评价现象越来越受关注。文章以“称誉性评价语”为研究对象,对语言中的称誉性评价现
本文从合作技术创新界面及其管理的含义、界面问题形成原因与界面管理的一般原理,界面分类与界面管理研究的历史阶段,界面管理组织设计四个方面对近年来国内外界面管理的研究
黑龙江省中小企业财务管理存在的问题,主要体现在财务管理人员专业素质低,管理机构设置简单;忽视流动资金资金管理;融资困难;筹资结构不合理,投资决策缺乏科学性等方面。黑龙
民族民间音乐存在世代相承的遗传基因,遗传基因是由诸多具象要素构成的音乐形态特征。各民族、各地区的遗传基因,又因地态、心态、史态、语态、乐态的不同而相异。它们又依据
我国民间音乐不但分宫商角徵羽等调式类别,同一类别又有不同的调式型号。这些不同类别与型号的调式,呈现着有序的地理性板块分布;同时在调式分布的区内和区间又呈现渐变性状
汉语的“NP1+指示代词+(量)+NP2”结构部分是歧义的,如“张伟这个助手”,可以理解为领属义的“张伟的这个助手”和同位义的“张伟=这个助手”,但“张伟这个教师”只含同位义,而
“再……也……”是现代汉语中的常用句式,在人们的口语交际和书面语中应用广泛;在对外汉语教学中,是中高级水平的汉语学习者需要掌握的语法点之一。然而,汉语学习者们在学习
诸葛亮《隆中对》,“未出茅庐,已知天下三分”,通过罗贯中小说形象思维,“一言而定其机势”。在农业社会,成为人们心态里的传统贤者,神化了的历史人物。其实《隆中对》之灼
为解决青花椒自然干制以及热风干制过程中极易褐变的问题,以提高干制青花椒产品品质,实验采用热泵干制技术干制青花椒。在单因素实验基础上,考察不同的热泵干制条件对干制青
总和生产力具有倍增生产能力;总和生产力内含着生产力剩余,其价值体现具有利益公共性,在生产资料私有制条件下,却首先为企业家私人占有;其价值构成具有模糊性,造成价值分配的