基于任务分析的自适应数据挑选

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:abc93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音识别领域,针对具体的任务进行分析进而挑选自适应数据,往往能够获得更好的自适应效果。本文提出一种基于任务分析的声学模型自适应方法,该方法针对特定任务,分析任务相关语音单元特性(覆盖度、混淆度);并采用贪婪算法在候选语音数据挑选一定量的数据,对声学模型进行自适应。实验表明,与使用全部候选数据进行自适应相比,基于任务分析的自适应数据挑选在仅使用10[%]的数据时即可获得相同或更好的自适应效果,通过进一步考虑混淆度,自适应性能能够得到进一步改善。
其他文献
本研究从透视乌鲁木齐维语与和田维语的韵律差异的角度来展示维语韵律的一些特点。在听感上,维族人很容易判断这两种维语方言,除了音段特征的不同外,韵律差异是区别的关键。但对
哼唱识别是音频检索的一个重要应用,其难点是音频歌曲数据的非结构性以及搜索速度和准确率平衡的问题。本文提出了新的数据库构造方法,将音频歌曲集用手工标注方法提取主旋律并
会议
The rapid variation of channel can induce the intercarrier interference in orthogonal frequency-division multiplexing (OFDM) systems. Intercarrier interference
针对传统的隐含马尔可夫模型(hidden Markov model ,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化
多口音英语学习者口语语音库(CELSCOM:Chinese EFLLearners speech corpus with multi-accents )旨在收集和建立中国不同方言区英语学习者的英语口语语音,一方面为英语语音识别
会议
面向有正音功能的对外汉语计算机辅助发音训练(CAPT)语音语料库的创制与标注是一个新的课题。本文介绍北京语言大学对外汉语CAPT语音语料库的建设思路与方法。该库分两期建设
会议
英音和美音是最为常见的英语目标口音。本文针对英语学习者存在的英美口音混杂现象,提出一种英美口音模型融合方法,提高发音质量评价性能,并压缩声学模型规模以适于嵌入式实现。
会议
本文分析讨论了连续语音识别系统中的快速高斯计算问题。语音信号的短时平稳特性,使得相邻语音帧可能共享相似的分布。利用该特性,估计当前帧与基准帧间似然值增量的最大值,以此
会议
本文介绍了参加DARPA GALE中文评测时,IBM开发的系统和算法最新进展。同时给出了在三个测试集上的识别结果,包括广播新闻和广播访谈类节目。结果显示,IBM GALE中文识别系统取得
利用分数阶付立叶变换(FrFT)在时频分析上的特点,提出一种新的谱减法-分数阶谱减法。首先,对每一帧带噪语音进行的分数阶付立叶变换,通过使得分数阶谱减法的信噪比达到最大从而