面向连续语音识别的半监督学习方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:jiwei5520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术日趋成熟,但仍存在一系列难题亟待解决。其中较为突出的是:对数据的标注成本高、耗时长,想获得大量的标注数据十分困难,而另一方面,却很容易获得大量的未标注数据。这种情况下,半监督学习是一种有效的学习方法,能够充分利用所有这些数据来得到较好的训练结果。本文主要研究连续语音识别中的半监督学习方法,着眼于对声学模型的性能的改进。针对经典的F. Wessel与H. Ney方法中的句子内滤除法会带来系统性能下降这个问题,本文提出一种自学习与确认相结合的策略,可以有效地提高声学模型的性能,在仅使用100句语料(约合20分钟)作为初始训练集的情况下,系统对测试集的识别率相对平均提高了4.9%。考虑到高置信度数据分布的集中性,文中同时使用高低置信度数据来训练系统,相比于仅应用高置信度数据的方法,系统对测试集的识别率平均提高了1.4%左右。另外,文中还尝试使用信息熵来进行数据筛选。根据最大熵原理,每次选择熵最大的数据加入到训练集中,实验表明依据信息熵进行数据筛选的半监督学习方法是有效、可行的。在当今很容易获得海量未标注数据的情况下,想要充分利用未标注数据,半监督学习的确是一个很明智的选择。
其他文献
在许多网上社群管理系统中(CWMS),为了管理其中的稀疏数据,大规模稀疏数据表(LST)相关的存储结构正在被越来越多的采用。一个LST通常含有数千以上的属性,并且一条记录仅在少
词汇复述研究旨在为词汇获取复述。词汇复述是上下文相关的,即对同一个词在不同上下文中应获取不同的复述词。本文定义了两个问题:(1)动态的词汇复述获取;(2)构建复述词典。
无线网格网是一种新型无线接入系统,支持多信道和多跳性。它融合了无线局域网(WLAN)和移动Ad Hoc二者的优势,成为解决Internet“最后一公里”问题的一种有效手段。无线网格网已
组播是除传统的单播和广播之外的第三种网络层传输方式,它允许将数据包发送到多个接收者,具有流量小、传递速度快、方便易用等特点。组播技术能够有效地解决单点发送、多点接收
目前,仿人机器人技术的研究已经逐渐成为一个热点。与传统的工业机器人相比,仿人机器人的结构更加类似于人类,在模仿人类的行为上,具有明显的优势。人类的身体结构,在大自然
网格是一种新型的分布式计算技术,能实现互联网上所有资源的互联互通,完成计算资源、存储资源、通信资源、软件资源、信息资源、知识资源、专家资源等的智能共享。网格已经广泛
随着计算机和网络技术的发展,目前的ADSL终端所提供的带宽已经不能满足人们的需求。华为根据终端用户需求,开发一个GPON光网络终端接入产品ONT550,能够满足家庭网络的需要。把光
北京邮电大学(北邮)在“十五”“211工程”建设期间,自主研发了一套具有北邮特色的数字图书馆集成服务系统。该系统包括虚拟参考咨询、信息门户、统一资源检索、数字资源管理
审计是商业银行风险防范的最后一道防线。随着我国进入WTO,商业银行在经营过程中面临的风险也越来越大。做好内部审计防范经营风险,成为商业银行工作的重中之重。审计管理系
在人类胚胎发育和疾病发生等过程中,miRNA扮演着重要的调控角色。而随着miRNA研究的深入,有关miRNA的生物学数据正迅速增多。由此,通过寻找生物学数据之间的联系,生物信息学