说话人自适应技术研究及其在电话信道下的关键词检出系统应用

被引量 : 4次 | 上传用户:handong007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,语音识别中的关键词检出技术的研究取得了很大的进展,并且应用在电话信道的条件下。然而在实际应用中,实验室“成功”的检出系统在鲁棒性、灵活性和自适应能力上还远远不能满足实际的需求,这一点在非特定人系统中体现突出。其原因在于说话人或者环境的改变都会给系统性能带来显著影响;当遇到特殊口音说话人,或者环境有一定的噪声时,系统的误识率会明显增加。针对上述问题,本文对与说话人相关的干扰因素进行了鲁棒性分析,并对如何提高系统的自适应能力进行了研究。 本文通过对模型参数自适应,说话人归一化和说话人聚类三方面对说话人自适应技术进行了讨论。在模型参数自适应方面介绍了目前使用较为广泛的MAP和MLLR自适应技术,并在此基础上研究了另外两种方法:Eigenvoice自适应和SMAP自适应。由于它们有着各自的优缺点,适合应用于各种实际情况下,因此本文成功地结合了这几种方法的优点,使用在电话信道下的关键词检出系统中。实验结果表明对新说话人在自适应数据为5句的时候平均误识率下降了6.3%;自适应数据为30句的时候,平均误识率下降了32.6%。在说话人聚类方面系统还使用了基于坐标轴的说话人聚类技术,与传统的方法(如基于GMM/HMM模型进行聚类)相比,这种方法的优点是对新说话人只需要较少的语料就可以确定其所属类。在说话人归一化方面介绍了声道长度归一化和倒谱均值归一化。在系统实现的过程中,文中将上面提到的三种说话人自适应技术有机地结合起来,构建了稳定的自适应模块;另外应用了前端语音增强与后续补偿相融合的抗噪方法增强了关键词检出系统的稳健性,实验表明这种方法尤其在低信噪比的情况下效果较好。最后给出了本文的结论和下一步的工作展望。
其他文献
由于行政执法机关不依法向司法机关移送涉嫌犯罪的案件,导致社会生活中出现了大量以罚代刑、有罪不究的情况,严重地破坏了社会主义市场经济秩序,影响了社会主义的法治权威和
许多大型选矿厂的矿石在破碎、运输过程中产生了大量的粉尘,老式的除尘加湿的除尘方法由于许多外在条件的限制已不能达到预期的效果。超细雾化抑尘系统是采用雾化原理从粉尘
高血压为目前最常见的慢性病,严重威胁人类健康。随着近年来对治疗和控制高血压药物的各方面研究的积极开展,具有降压和控制血压稳定性的动物药越来越引人关注。本文对近年来
金庸以武侠小说的幻景形式和生花妙笔有效地掩盖了现实处境的严峻,完美地连缀了来自现实的矛盾的裂缝,而向世人昭示出一种理想化、和谐化的世界的可能性,并防止历史文化语境
城市径流污染已成为比较严重的城市面源污染,对城市河道和水生态环境带来了极其不利影响。在城市雨水径流污染途径分析基础上,提出了径流污染源头控制、雨洪利用消减污染以及
随着人类文明的发展,越来越多的人能积极地面对死亡、规范死亡,安乐死的问题由此产生,然而我国目前对安乐死尚未立法加以规范。作为一个跨学科理论问题,安乐死主要涉及刑法学
真实空间(太空)环境仿真对于人类航天活动具有重要研究意义。近地空间环境三维建模与可视化技术是其中一项关键技术,属于前沿性的研究领域。本文重点对此项技术进行了研究,主
“一卡通——门禁考勤管理系统”是用现代最新智能科技产品--非接触式IC 卡应用的管理系统。在实施区域内,将IC 卡制作成"员工卡"、"工作证"或"学员卡"等身份识别证件,在终端
目的论将翻译看作有目的的交际行为,认为翻译过程应以实现译文在译语文化中的预期功能为首要原则,从而突破了对等翻译理论的限制,使得翻译标准多元化。广告翻译也应以目的论
滑稽戏是流行于江、浙、沪吴语地区的地方剧种,它的前身是趣剧。趣剧是一种营建“滑稽套子”的艺术。它虽以致笑为目的,但在笑场的背后却隐藏着对社会的丑恶和人性的劣根所进