基于深度学习的彝语语音识别的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:jonnykang001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能是21世纪引领世界未来科技领域发展和生活方式改变的风向标。语音识别技术是人工智能目前落地较为成功的技术之一,它能够将语音转换为文本来实现人机交互。由于目前的语音识别研究主要针对主流语言和藏语、东干语等部分少数民族语言,对少数民族彝语的语音识别研究较少,故而本文展开了基于深度学习方法的彝语连续语音识别的研究。本论文的主要工作和创新如下:1.建立了彝语语料库和彝汉混合语料库。构建彝语语料库时,根据彝语的发音特点设计了反映彝语音系特征的5383句文本,每个彝字均用声母、韵母和声调标注;邀请一名女性说话人以单声道、16 k Hz采样率、16位采样精度录制并保存为用语音序号记录的WAV文件,对录音语句进行切分、校对、检测,将不符合录音质量的句子进行补录,录制的彝语语料库时长约5 h。而对于彝汉混合语料库的构建,通过对比彝语和汉语语音系统、研究彝、汉两种语言的发音特点,本文在原有彝语语料的基础上额外增加了源于公开的thchs30清华中文语料库约28 h的汉语语料,用国际音标转写字的声母、韵母,用数字统一声调的调值。2.运用了4种声学建模方法来实现彝语语音识别,分别为隐马尔科夫模型(Hidden Markov Model,HMM)、深度神经网络(Deep Neural Networks,DNN)、时延神经网络(Time Delay Neural Network,TDNN)和端到端(End-to-End)声学模型,并进行了对比实验。实验结果表明基于深度学习方法的彝语语音识别词错率要优于传统HMM方法,TDNN模型的识别词错率低至16.5%,而端到端模型因彝语语料的不足导致其识别效果最差,词错率为47.40%。3.研究了3种不同声学特征对彝语语音识别词错率的影响。基于DNN模型实现了梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)、瓶颈特征、瓶颈复合特征的彝语语音识别,结果显示基于MFCC特征的彝语识别词错率较低。考虑到语料的不足可能会影响实验结果,本文选择thchs30汉语语料辅助建模训练进行验证。实验结果表明,混合语料的复合特征识别词错率最低,为15.01%。4.实现了基于迁移学习方法的彝语连续语音识别。先用杰卡德相似系数比较了彝语和汉语的语言相似性,确定thchs30汉语语料作为迁移学习的源域,然后进行了彝语DNN-HMM模型迁移。实验结果表明用迁移学习方法进行彝语语音识别的词错误率比DNN模型降低了3.16%。
其他文献
哺乳动物的精子产生于睾丸,但却是在附睾管腔微环境相关因子的作用下成熟。在这一过程中,附睾蛋白扮演着重要角色。附睾关键蛋白分泌紊乱会导致精子成熟异常,进而导致雄性不育,因此,理解附睾特异蛋白的功能有助于治疗雄性不育。之前的研究表明,GLB1L4(Beta-Galactosidase-1 Like 4,GLB1L4)蛋白在大鼠附睾头部主细胞特异性表达,其能被分泌到附睾管腔中,当附睾发育完成,精子进入附
牛奶因其丰富的营养成分而被称为满足人类营养需求的“全价食物”,而乳脂不仅仅是牛奶的主要能量成分,更决定了乳制品的物理特性,制造特性及感官品质。因此,如何提升乳脂率一直是国内外乳制品产业亟待解决的科学问题,而从分子生物学角度出发研究调控乳脂肪形成的基因网络也已成为该领域的研究热点。越来越多的研究表明,在乳腺上皮细胞中,miRNA可抑制其靶标mRNA的表达,并通过相应的靶基因参与到下游信号的传导途径从
鸡胚性腺的发育具有二态性,即雌雄鸡胚性腺发育不相同,雄性鸡胚双侧性腺发育为睾丸,而雌性鸡胚性腺右侧发生退化,左侧性腺发育为卵巢。这一生物过程是由许多生物因子共同作用的结果,但其具体机制还未见报道。miR-199a是具有调控细胞增殖凋亡作用的miRNA,然而有关gga-miR-199a是否在鸡胚性腺发育中起作用的研究并不多,主要是由于可用于体外研究基因功能的鸡细胞系较少,且鸡细胞培养对温度和血清的要
视网膜血管分割对糖尿病视网膜病变、高血压、心血管和脑血管等疾病的诊断有重要的研究价值和意义。糖尿病可以诱发许多并发症,其中眼部并发症有糖尿病性视网膜病变、白内障,青光眼等,它们的致盲是有不可逆转的。眼底作为人体能够直接观察到血管的部位,其自身的变化,如血管宽度、角度、分支形态和有无再生血管等,为眼科疾病的前期诊断提供了依据。目前诊断眼底疾病的主要方式是眼底血管分析,眼底血管分割则是疾病诊断分析的必
有机微量元素生物利用率高,使用低水平的有机微量元素替代无机微量元素能够在保证正常生产性能、健康的情况下,减少环境中的微量元素的排放。但是,目前已有研究中低水平有机微量元素替代无机微量元素的效果不一致。因此,本研究的目的是在泌乳奶山羊日粮中应用无机微量元素50%添加水平的有机微量元素替代方案,通过对奶山羊的泌乳性能、血液和乳中微量元素状态、抗氧化性能、消化代谢、瘤胃发酵功能等进行评价,为有机微量元素
硬蜱能够携带和传播广泛的病原体(细菌、病毒和原生动物),这些病原体对全球人类和动物的健康都有很大的威胁。关于蜱虫分布及其携带病原体方面的研究还相对较少。因此,本研究旨在掌握和完善陕西省硬蜱的种类及其携带病原情况,为进一步完善相应的蜱媒疾病的防控和深入研究提供数据支撑。2017年3月至2020年9月,收集陕西省西安市、咸阳市、安康市和汉中市共4个地区分别来自刺猬、犬和牛等动物体表的蜱。通过对蜱采用形
金黄色葡萄球菌(Staphylococcus aureus,S.aureus)易引起奶牛慢性和隐性的乳腺内感染(Intramammary Infections,IMI),其生物被膜(biofilm,BF)的形成能力是推动IMI发生发展的关键因素,BF是一种可以在生物和非生物的表面形成的有组织的、复杂的和固着的结构性细菌群落,BF的形成能够使S.aureus在恶劣环境中生存并持久存在。近年来,由于临
松鼠葡萄球菌作为机会性致病菌能造成多种感染和疾病,并且近年来在家畜生产全过程以及临床的检出率逐渐上升。抗生素在畜牧业中的不合理使用,造成的抗生素筛选压力刺激诱导松鼠葡萄球菌抗生素耐药性产生和扩散,使得家畜细菌感染难以治愈,影响畜牧产品质量。并因此,阐明畜牧源松鼠葡萄球菌的抗生素耐药性的产生,并通过分子生物学和基因组学方法揭示其遗传机制,对于促进畜牧业发展具有积极意义。绝大多数松鼠葡萄球菌含有mec
子宫内膜炎是导致母畜流产、屡配不孕的重要原因,严重影响母畜的繁殖率和生产性能。子宫内膜炎的致病微生物和其致病因子,是导致子宫组织损伤、引起子宫内膜炎的主要原因。大肠杆菌、芽孢杆菌、化脓隐秘杆菌、链球菌、葡萄球菌等是导致子宫产后感染主要致病菌,脂多糖(lipopolysaccharide,LPS)是子宫内膜炎致病菌大肠杆菌的致病因子,能够引起子宫内膜的炎症。尽管LPS引起的炎症反应已有诸多报道,但是
绒山羊作为重要的经济动物之一,以生产优质羊绒而著称,如何提高羊绒产量和绒毛品质一直以来备受研究者和生产者的关注。毛囊发育的周期变化直接影响羊绒产量和绒毛品质,这一过程受到多种基因和信号通路的共同调控,表观遗传修饰在协调体内基因表达情况,响应环境变化中发挥着至关重要的作用。在多种表观遗传修饰的研究中,有关组蛋白修饰对毛囊周期变化的影响多见于小鼠上,在绒山羊皮肤毛囊发育中的研究未见报道。H3K27me