借助音频数据的发音字典新词学习方法

来源 :西安交通大学学报 | 被引量 : 0次 | 上传用户:thiscf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对已有的发音字典扩展方法只能从文本数据中学习新词而无法学习到音频数据中新词的问题,提出了一种基于混合语音识别系统的发音字典新词学习方法。该方法首先分别采用音节和字母音素对混合识别系统对音频数据进行集外词识别,利用系统间的互补性得到尽可能多的新词及其发音候选,然后借助感知器与最大熵模型对得到的新词及发音进行优化,降低错误率,最后实现发音字典的扩展,并利用语法语义信息完成对语言模型参数更新。基于华尔街日报(WSJ)语料库的连续语音识别实验表明:该方法可以有效学习到音频数据中的未知新词,采取的数据优化策略极大
其他文献
为深入学习贯彻党的十八届三中全会关于“推进法治中国建设,深化司法体制改革”的精神,2013年12月13日至14日,石河子大学政法学院举办第十届“西域法学高峰论坛”,论坛主题是“司
为了更好地揭示非阻塞性颗粒阻尼器(NOPD)的减振机理,基于振动颗粒物质的流变特性,研究了NOPD的阻尼效果和其内部阻尼颗粒运动形态之间的关系,通过实验确定了NOPD发挥最优阻尼
数学素质是人的素质中重要的成分之一,这种素质要靠后天的培养才能形成。其内涵主要是指人认识和处理数量关系、空间形成的内在规律,逻辑关系及抽象模式的悟性与潜能。高职教
采用纳洛酮拮抗剂或氨茶碱呼吸兴奋剂治疗新生儿呼吸暂停并比较其疗效,分析报告如下:1 资料与方法1.1一般资料高危新生儿病房2000年1月~2000年8月收住的入院患儿,对照组35例,
首尔/韩国(js)-夜思德国,思绪飞翔-德国诗人海涅(Heinrich Heine)。对于智能手机和平板先锋的苹果公司经理而言,正是韩国三星扰乱了夜晚的平静。该公司让位于加州的这个Cupertino巨
玄奘的"五不翻"源自经年累月的翻译实践,虽非新论,但依然生机勃勃。"新疆生产建设兵团"英译名不统一,其中出处相对权威的英译名"Xinjiang Production and Construction Corps(XPCC)"
2013年10月26日,“兵团屯垦戍边研究中心”成立仪式暨首届学术论坛在石河子大学举行。兵团党委常委、副政委卢晓峰和石河子大学校长向本春出席成立仪式,并共同为该中心揭牌。兵
近日,国内首套智能数字化齿轮精密加工装备生产线在我国精密数控机床研发生产基地——秦川机床工具集团问世。该项针对精密齿轮高效加工的成套工艺技术解决方案以先进的数控机
TDK公司发布的一款新的爱普科斯(EPCOS)焊片式系列铝电解电容器的纹波电流能力比之前的爱普科斯(EPCOS)系列增强了多达25%,其中新B43642*系列电容器尺寸紧凑: