基于半监督学习的语音自动标注方法研究

来源 :中国地质大学(北京) | 被引量 : 0次 | 上传用户:julykoko
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别作为人工智能中发展较为成熟的一个应用领域受到各大商家和研究机构的追捧,从智能音箱混战到层出不穷的语音交互的应用,可以说智能语音技术无论是其商业化和技术落地都远超其他方向的人工智能。但智能语音的发展需要庞大的语音训练数据量作为支撑,但训练数据获取存在两方面问题,一是源数据获取困难导致量级很小不足供训练使用,二是源数据质量低而需要大量的人工标注和筛选工作。而经过人工标注的优质样本成本非常高,限制了语音识别领域的门槛,并严重制约小样本领域语音人工智能的发展。因此相比于传统的全监督学习训练和人工标注,基于半监督学习的语音自动标注方法研究在小样本领域和标注成本上都有较好的优势,值得做出创新性尝试。本文主要是针对小样本专业领域语音数据进行标注分类研究,研究过程中的创新点在于将半监督学习的方法和思想应用到语音标注模型中,并且在标注后续的分类模型中根据实际业务需要应用了按需加权的方法,大大提高了语音关键词分类的效率。研究内容主要包括两大模型,即半监督学习语音关键字标注模型和按需加权决策树分类优化模型。首先对传统条件随机场模型进行优化,即对其综合应用半监督学习方法中的协同训练技术,根据高质量原始语音小样本标注集训练初始分类器,再根据半监督学习的特性,不断的将新训练得到的高置信度中间结果加入到初始标注集中,直到标注分类结果收敛,得到关键字标注数据;第二步再通过按需加权决策树优化模型,为相关标注领域的关键字(如医疗、交通、卫生等)进行筛选分裂根节点过程中的加权,从而最终完成对样本音频的分类标注。经过多轮实验相比传统监督模型方法,该标注方法的优势在于小样本训练数据情况下,可以得到较好准确性;对于某些训练数据难以获得的公司或领域更加实用。相比于传统人工标注,半监督模型的准确率还远远不及,但因为能节约大量成本,因此在目前阶段可以用于人工标注之前用以初步标注。
其他文献
通过述评2000年至2009年有关教师书面反馈的研究成果,重点讨论了教师书面反馈有效性考辩、具体功效和反馈类型对二语写作的影响,并且指出了当前研究成果对教师优化书面反馈的
对印尼、蒙古、美国等国炼焦煤质量的工业指标、工艺指标、煤岩指标、单种煤焦炭显微结构进行研究,提出采购部门在引进新增炼焦煤资源时,不能仅依据国内常用工业指标和煤岩指
绿脓杆菌广泛分布于自然界及正常动物皮肤、肠道和呼吸道,是临床上较常见的条件致病茵之一。常根据微生物学、免疫学及流行病学结合聚合酶链反应(PCR)等现代分子生物学技术进行
在当前的语文教学与学习过程中,阅读连接着字词学习、理解能力和作文能力的培养。阅读教学可以分为课内阅读和课外阅读。小学中年级是小学低年级向高年级的过渡期,课外阅读之于这时期的学生来说是非常重要的。海量的课外阅读能够丰富学生的知识库,为小学高年级及以后的语文学习奠定基础。因此激发小学中年级学生的阅读兴趣和培养他们的阅读习惯势在必行。本文主要研究如何对中年级小学生课外阅读进行有效地指导。通过调查青岛市黄
湖泊缓冲带在湖泊流域空间布局中具有特殊地位,缓冲带内的湿地对于保障流域生态健康和湖泊水环境质量具有十分重要的意义.本研究以太湖竺山湾湖泊缓冲带内的竺山湖湿地生态系
<正> 技术现象的哲学思考,技术对人的自然和社会存在、人的意识和自我意识以及社会和文化的影响,成了当代哲学不可分割的组成部分。每个职业革命家都认识到,很难设想:某个事
燃料油中噻吩类化合物的脱除是炼油行业的技术挑战之一,而吸附脱硫、萃取脱硫和催化氧化脱硫等非加氢脱硫技术颇有潜力,值得进一步研究探索。本文分别通过PVP和PVIM与杂多酸
以广东省生物技术产业为研究对象,旨在探寻技术密集型产业中,邻近性对合作成果的重要性。对从Web of Science数据库采集的2001—2010年广东生物技术领域科学计量数据进行回归
所谓炼油厂,就是通过一系列的物理方法或者化学方法来进行加工,将开采出的各种油变成可使用的产品。炼油厂主要由两个部分组成,一个是炼油得过程,另外一个是炼油厂的设备。本文主
目的:近年来,可植入的钛及钛合金医疗植入材料已得到很好的发展并在临床中广泛应用以替换受损的关节组织并恢复其功能。尽管钛及钛合金具有优异的生物相容性和良好的机械性能,但种植体-骨结合时间过长以及结合不良所导致的种植失败仍有发生,这提示我们需要对植入物进行表面修饰以改善种植体-骨结合过程,借以提高植入物的成功率。在过去的关于医疗器械表面修饰的研究中,研究者们的关注重点在于某些细胞的生物学行为。随着对“