语音识别码本状态间的线性和非线性相关性

来源 :第六届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:limi330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前很多语音识别的快速自适应算法都把最大限度地利用声学模型(码本)参数的先验信息作为主要手段,尤其是码本状态间的相关性,在这类自适应算法中用得非常普遍.由于自适应算法对于数据和时间的需要,这类算法往往只能利用状态间的线性相关性,对于非线性相关性,则不但无法利用,而且无法度量.信息论中以互信息的方法来度量相关性(包括线性和非线性相关性),但实际算法中这需要大量的统计数据,无法适用于以说话人为样本的码本分量相关性计算.本文提出一种利用预测残差来度量随机变量相关性的方法,并给出分段预测相关指数和多项式预测相关指数两类相关性测度.在模拟数据上实验结果显示这种相关性的测度是合理而有效的.利用这两类相关性测度,我们详细地分析了码本状态间的相关性,讨论了线性相关性和非线性相关性的关系.结论表明,当两个状态是强相关时,非线性相关性可以忽略,因此,在快速自适应算法中从线性相关性入手是合理的.
其他文献
一直以来建筑工程因其特点,具有很长的工期,而在冬季不得不面对停工的情况。而如何在寒冷的冬季既能够不停工,还能够保证工程的质量就成为冬季施工中一个关键问题。本文将对建筑
我国能源、土地、水、原材料等资源严重短缺,且实际利用效率较低,要走可持续发展道路,使建筑尽可能少的消耗不可再生资源,发展节能与环保的绿色建筑刻不容缓。文章以绿色建筑节能
说话人自适应技术是非特定人语音识别研究的重要课题.本文提出一种结合了说话人聚类和模型自适应的说话人自适应框架,有效地提高了自适应速度和性能.同时,通过实验验证,基元
在建筑结构中加入隔震设计或是在已有建筑中加入隔震技术的改造将有助于降低建筑物特别是高层建筑在地震中的影响。
期刊
考虑上下文相关建立三音子单元能够明显的提高语音识别系统的性能.本文针对汉语语音的单音节结构的特点,提出了一种新的建立二音子识别单元的方法.这种方法考虑连续语音音节
会议
本文主要对县级公路路面施工及艺术进行论述,并结合县级公路路面常见的结构型式进行分析,且根据笔者多年来的工作经验和相关知识提出了县级公路路面施工质量控制的相关建议,希望
本文对岩土工程地质勘察的质量控制进行了分析,从岩土工程地质勘察的流程和质量控制因素的角度,充分说明影响岩土地址勘察质量控制的重要性,寻找岩土工程地质勘察质量的控制方法
在连续语音中,说话语速的差异非常大.过快或过慢的语速往往会导致识别错误,特别是插入错误和删除错误的增加,从而使识别性能大幅度下降.考虑到HMM中状态段长与说话语速的强相
尽管作为当前最为流行的语音识别模型,HMM由于采用了状态输出独立同分布假设,忽略了对语音现象中固有的时间相关性的描述.本文引入了一个更为灵活的语音描述统计框架——广义
会议
顶进施工在我国铁路工程中的应用非常多,施工技术已经日趋成熟.本文主要根据宁西铁路西安至合肥段增建二线工程(武汉局管段)站前工程NXZQ-3标段的K788+620顶进涵设计施工情况