无标注的含噪中文长篇幅语音文本的文语对齐研究

来源 :中国海洋大学学报:自然科学版 | 被引量 : 0次 | 上传用户:laoxuslx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文语对齐技术是语音识别领域中的一项关键技术。传统文语对齐方法利用语音识别器将文语对齐问题转换成了文本与文本的对齐问题,但是该方法依赖于大量有标注数据训练的声学模型。本文提出一种利用开放识别引擎和基于有限状态自动机的语言模型来得到语音与文本一一对齐数据的算法,来摆脱对于大量标注数据的依赖。实验表明利用该算法得到语音文本数据的准确率为99%,可以用于识别器的训练。接着利用该部分数据训练一个面向要识别领域的声学模型,来对文本和语音进行迭代的,自适应的文语对齐。
其他文献
研究具有加权非线性非局部边界条件的非局部热方程初边值问题中非负解的整体存在和爆破性质。利用上下解的方法找到了边界上的加权函数及非线性指数对解的整体存在性与爆破的
中国首家股份制足球俱乐部——云南天元足球俱乐部于1995年9月28日在昆明正式成立了。天元足球俱乐部是经云南省体委批准,在云南省民政厅登记注册的社团法人实体,为中国足球
目的评价早期控制性应用VSD负压引流在严重软组织肿胀小腿闭合性骨折内固定手术中的临床疗效。方法笔者2012年12月-2015年1月对27例病例,分别采用(治疗组)提前控制性使用VSD引
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
研究了基于离散趋近律方法的变结构控制设计问题。借助于S型函数提出了的一种离散趋近律方法,应用到了时滞多输入离散系统。应用该趋近律设计的变结构控制系统,其特点是可以
分别于2012年3和7月对长江口及其邻近海域进行了大面调查,测定了表、底层海水中溶解甲烷浓度,并对其海-气交换通量进行了估算。结果表明,春、夏季表层甲烷的平均浓度分别为(28
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
在当前供给侧改革的大背景下,从资金"供给侧"深入探讨金融发展对江苏省全要素生产率的影响路径,具有较强的研究价值和现实意义。本文首先从理论角度剖析了金融发展对全要素生
中医膳食平衡思想内涵丰富 ,主要包括膳食结构合理、阴阳协调、性味和谐、辨证用膳、因人而膳、因地而膳、因时而膳。其特点明显 ,具有整体平衡观和动态平衡观 ,揭示了人类吃
摘 要:近年来我国医患关系日趋紧张,医疗纠纷数量明显增加且呈逐年上升的趋势,患方侮辱伤害医生的事件时有发生,且个别地区连续发生杀害医生的恶性事件,引发的社会反响也越来越大。通过系列调查可以看到,在同等医疗水平条件下,接受过系统全面医患沟通课程的临床医生能取得良好的沟通效果,能提高患者的满意度,保持医患和谐。  关键词:医患沟通课程 ;住院医生;患者满意度  中图分类号:C961 文献标志码:A 文