基于决策树的海量语音数据处理与建模

来源 :第六届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:yjcog
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于决策树的海量语音数据处理与建模方法,这种方法可以有效地结合语境与非语境信息,并利用决策树方法本身对模型的预测与鲁棒估计特性,对海量语音训练数据进行分类与建模.这种方法包括两部分:利用非语镜特征扩展决策树,生成多套非语境因素相关的高精度声学模型:利用最大似然准则依据少量自适应数据,动态生成测试人相关声学模型.对两个数据集进行测试,相对误识率平均下降8﹪-10﹪,说明了这种方法对海量语音数据处理的有效性.
其他文献
我国能源、土地、水、原材料等资源严重短缺,且实际利用效率较低,要走可持续发展道路,使建筑尽可能少的消耗不可再生资源,发展节能与环保的绿色建筑刻不容缓。文章以绿色建筑节能
说话人自适应技术是非特定人语音识别研究的重要课题.本文提出一种结合了说话人聚类和模型自适应的说话人自适应框架,有效地提高了自适应速度和性能.同时,通过实验验证,基元
在建筑结构中加入隔震设计或是在已有建筑中加入隔震技术的改造将有助于降低建筑物特别是高层建筑在地震中的影响。
期刊
考虑上下文相关建立三音子单元能够明显的提高语音识别系统的性能.本文针对汉语语音的单音节结构的特点,提出了一种新的建立二音子识别单元的方法.这种方法考虑连续语音音节
会议
本文主要对县级公路路面施工及艺术进行论述,并结合县级公路路面常见的结构型式进行分析,且根据笔者多年来的工作经验和相关知识提出了县级公路路面施工质量控制的相关建议,希望
本文对岩土工程地质勘察的质量控制进行了分析,从岩土工程地质勘察的流程和质量控制因素的角度,充分说明影响岩土地址勘察质量控制的重要性,寻找岩土工程地质勘察质量的控制方法
在连续语音中,说话语速的差异非常大.过快或过慢的语速往往会导致识别错误,特别是插入错误和删除错误的增加,从而使识别性能大幅度下降.考虑到HMM中状态段长与说话语速的强相
尽管作为当前最为流行的语音识别模型,HMM由于采用了状态输出独立同分布假设,忽略了对语音现象中固有的时间相关性的描述.本文引入了一个更为灵活的语音描述统计框架——广义
会议
顶进施工在我国铁路工程中的应用非常多,施工技术已经日趋成熟.本文主要根据宁西铁路西安至合肥段增建二线工程(武汉局管段)站前工程NXZQ-3标段的K788+620顶进涵设计施工情况
目前很多语音识别的快速自适应算法都把最大限度地利用声学模型(码本)参数的先验信息作为主要手段,尤其是码本状态间的相关性,在这类自适应算法中用得非常普遍.由于自适应算
会议