基于ASR的藏族说话人国家通用语言口语发音偏误检测研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:Butterfly1982_2_2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为促进各民族团结与文化融合,国家大力推动并开展少数民族国家通用语言的教育普及工作。由于藏族有其特有的语言及文字,因此藏族说话人的国家通用语言口语发音存在明显的“民族腔民族调”,也令国家的口语教学工作遇到了较大的阻力。目前对于国内藏族说话人的口语发音偏误检测研究相对较少,因此,本文充分结合智能语音信息处理技术,研究藏族说话人的口语发音偏误问题。本文基于自动语音识别(Automatic Speech Recognition,ASR)技术对发音偏误检测进行研究,主要对语料库建立与标注,发音检测任务中的打分映射模型以及声学模型的训练进行了研究,最后基于研究结果对藏族说话人的口语发音偏误信息进行统计。本文的创新点及主要研究内容如下:1.语料库的设计与人工标注实验。语料库的设计包括中介语语料库的设计和国家通用语言标准发音语料库的设计。中介语语料库根据藏语方言与汉语普通话的发音特点对比设计了语料库,用于测试发音偏误检测性能。国家通用语言标准发音语料库主要用于训练声学模型。然后根据本文提出的标注规则对中介语语料库进行人工标注实验。2.采用声调检测及GOP算法对藏族说话人发音偏误检测进行研究。发音良好度(Goodness of Pronunciation,GOP)是一种常用的针对发音内容准确度的打分算法。本文结合声调检测和GOP算法,利用神经网络训练声学模型,对藏族说话人的国家通用语言口语发音进行偏误检测实验。与传统的GOP打分模型相比,本文提出的方法提高了偏误检测准确率。3.采用基于DFSMN-CTC的声学模型对藏族说话人的发音偏误检测进行研究。本文使用深度前馈序列记忆网络(feedforward sequential memory networks,DFSMN)模型,以链接时序分类(Connectionist Temporal Classification,CTC)作为模型的损失函数搭建了DFSMN-CTC声学模型进行音素层的发音偏误检测实验。与传统声学模型对比,准确率达到88.73%,本文提出的方法提高了偏误检测的效率及准确率。4.藏族说话人国家通用语言口语发音偏误分析。根据本文前期的研究结果,得出藏族说话人分别在声母、韵母、声调三方面的具体偏误信息,分别展开统计了偏误占比。
其他文献
公益性捐赠是实现社会收入公平分配,缩小贫富差异的有效手段。在政府调节的盲区,也可起到补充、完善的作用。本文先从理论上进行分析,阐述了政府鼓励企业公益性捐赠的理论依据,以及所得税政策影响企业公益性捐赠的作用机制。然后本文运用实证分析法,选取了2015年到2019年间,732家上市企业的数据进行分析。选取了所得税中关于捐赠支出的优惠政策即选择所得税实际负担率作为核心解释变量,企业规模、资产负债率、资产
学位
21世纪以来,突发事件时有爆发,以其特有的紧迫性和不确定性给世界经济带来巨大负向冲击,并从需求侧和供给侧双向挤压实体经济,对实体经济的冲击也会沿着产业链、供应链与资金链传导至金融市场,加剧企业融资约束困境,导致宏观经济不确定性再度上升,陷入恶性循环。本文以新冠疫情事件为证据,研究突发事件对企业投资的冲击,结合现状分析以及理论分析提出研究假说,并利用2019年第二季度至2020年第四季度的A股非金融
学位
近年来,随着国家对少数民族音乐艺术文化传承和保护的重视,以学校音乐教育为载体,弘扬和发展民族音乐文化开始受到社会各界学者和专家的支持。长调民歌作为蒙古族历史悠久、音乐风格鲜明的歌唱艺术形式之一,已于2005年被列入了第三批“人类口头和非物质文化遗产代表作”。这种极具地域代表性的音乐文化形式应在本民族地区以教育教学方式传承弘扬下去,被当代学生接受和喜爱。本文以在少数民族地区学校音乐课堂开展的本土音乐
学位
黄金股票内含了股票属性、商品属性和货币属性,在金融市场承担了独一无二的作用,也正是由于其复杂性,对于其定价因素的研究一直没有定论。黄金股的复杂、复合金融资产属性还可以承担大类资产配置功能,为投资者、金融机构和资管行业的发展注入新的活力。从2008年全球金融危机以来,世界政治经济不确定性不仅没有趋缓,而且有愈演愈烈之势。尤其是美联储的政策换挡、局部地区军事冲突,更是令黄金类资产成为投资者的焦点。相较
学位
绩效考核一直是企业人力资源管理中的热点问题和核心内容,它直接关系到员工的工作主动性和对企业的认同感。随着社会主义市场经济体制的逐步发展,企业面临的市场竞争越来越激烈,一套行之有效的绩效考核办法,可以促使员工达成工作目标,增强企业的核心竞争力,最终实现企业战略目标。积分制管理作为一种特殊的绩效考核办法,在企业实践中的运用越来越广泛,尤其是在国有企业。Z酒店作为一个典型的“事改企”国营酒店,其在员工积
学位
本文以镀铜石墨烯铝基复合材料为研究对象,以石墨烯为复合材料增强相,7075铝合金为基体,对石墨烯进行化学镀铜,改善石墨烯与金属基体的界面结合,使其能够更好地分散在铝合金基体中,采用粉末冶金、热锻、热处理(固溶处理、人工时效等)等工艺制备镀铜石墨烯增强铝基复合材料;通过MMS-100型热模拟试验机进行热压缩实验,研究镀铜石墨烯铝基复合材料在热变形温度为300℃-450℃,应变速率0.001s-1-s
学位
在人民生活水平持续提高的消费观念不断转变的作用下,马铃薯的市场需求量不断增长,马铃薯种植在农业经济和区域经济发展中的地位日趋重要。作为我国马铃薯生产的优势区之一,西北地区马铃薯种植对于促进当地经济社会发展、提高人民生活水平等方面具有重要意义。本文在系统梳理和借鉴国内外学术界相关研究成果的基础上,以《全国农产品成本收益资料汇编》为数据分析依据,并采用成本收益分析法,对我国西北地区各省份2011-20
学位
结直肠癌(Colorectal Cancer,CRC)是最常见的恶性肿瘤之一,尽管目前治疗策略取得了进步,但结直肠癌的死亡率仍然很高,因此迫切需要探索肿瘤发生的驱动因素,更好地理解结直肠癌发生和发展的分子机制。近些年来,包括RNA甲基化修饰在内的表观遗传调控机制是肿瘤生物学中新兴的研究前沿。RNA N~6-甲基腺嘌呤(N~6-methyladenosine,m6A)修饰作为真核生物中最丰富的转录后
学位
诗歌中的“不眠”书写,自《诗经》《楚辞》、汉乐府和《古诗十九首》之后,在魏晋南北朝时期开始大量出现。一方面,此时期的“不眠”书写,继承了《诗经》、汉乐府民歌和《古诗十九首》在内容上和情感表达上的特征;另一方面又深化了“不眠”书写的内涵,丰富了“不眠”书写的情感意蕴,呈现出一种成熟的状态。本文所论“不眠”书写,指魏晋南北朝诗歌中直接或间接描写“夜不能寐”的情境。全文除绪论和结语外共分为四章,分别论述
学位
中唐是继魏晋南北朝之后又一重要的文学创作变革时期,这一时期内文学创作风格变化较大,以韩愈和柳宗元为首的“古文运动”倡导者打破了南北朝以来绮糜的文风。韩愈以文化巨擘的身份亲自参与并引领了这个时代散文创作的变革,他的著述是十分丰富的,涉及众多领域。散文是韩愈成就最高的一个领域,而碑志文创作在韩愈散文创作中又成就颇高,是研究韩愈散文不容回避的部分,亦是了解韩愈创作的重要切入点。其碑志文的创新之处,除语言
学位