声学建模中若干问题的研究

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:gotomis
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息爆炸并且更多的信息是通过音频视频作为载体来进行传播的年代,如何快速、高效的把相关的信息分类,并且从中找出我们需要的部分就成为现实生活中需要面对的事情,这也是连续语音识别的发展趋势。广播语音由于具有复杂背景环境和非特定人等特点,再加上近乎于海量的数据,使得人工分类和标注变得越来越不可行。我们需要系统能够通过前期少量的未标注或者部分标注的数据来选择其他更有用的数据,用来提高声学模型的识别率,以此减少人工标注和使用全部数据所带来时间和精力上的浪费。本文通过对广播语音数据特点的分析,选择适当的规则建立广播语音库,以及建立相应的广播语音标注系统。同时通过设计主动学习算法,搭建主动学习系统,通过对于初始样本随机选择和K-L距离选择的比较,以及其他训练样本中随机选择,最大似然(MLE)和后验概率的实验比较中,得出使用K-L距离选择初始样本。并且用基于混淆网络的后验概率选择相应的样本可以大大节省标注量,提高系统效率。此外,本文还进行了声韵母基元模型和音素基元模型对于连续语音识别性能的比较,结果显示声韵母更适合中文的声学建模。
其他文献
就运动控制器的性能和技术水平而言,与国外同类产品相比,所采用的硬件技术并没有太大差距。其差距主要体现在控制算法和二次开发的难度方面。国外的运动控制器产品都提供了界
随着能源短缺和环境污染问题越来越成为全球性的问题,上海作为国际化大都市率先在城市轨道交通方面探索研究建立能耗评价体系。本文主要以建立上海市轨道交通能耗评价体系的目
声音信号的提取和处理技术是普适计算中的一个关键技术。它是一种应用系统,该应用系统利用环境中的上下文信息向用户主动提供与用户任务相关的信息和服务。它在人机交互、信
随着计算机技术的普及和发展,电子警察及智能交通应用得越来越广泛,而车牌自动识别技术的实现又是其中的关键。但是由于自然光照条件、车牌本身因素、摄像器材、环境等很多方
铝是当今世界最常用的工业金属之一,是国民经济发展的重要基础原材料。自1886年美国的霍尔和法国的埃鲁特同时发明了电解法制铝工艺之后,铝电解工艺得到了迅速发展,但对铝电
新一代网络多媒体技术给远程教育发展提供了技术支持,现代远程教育基于数字化媒体、计算机网络、数据挖掘和现代通信技术将教师与学员之间相互分离,使他们在分离状态下进行非
振动主动控制是最近二十年发展起来的一门新兴学科,主要研究结构振动主动控制的理论、方法和措施。以压电材料作为传感器和作动器的智能结构是目前振动控制工程研究中的一个
人脸识别技术作为生物识别技术中的一种,它具有直接、友好、方便的特点,易为用户所接受,因此成为了身份验证的最理想依据。考勤是现代企业管理的基础,也是衡量企业管理水平的
双足机器人的研究始于二十世纪六十年代末,其仿人的外形和步行运动方式,以及广泛应用的社会前景,促进了多学科的融合和进步。虽然针对双足机器人的研究只有四十多年的历史,但
复杂网络因其在自然界和人类社会中的普遍存在性而得到了科学界的广泛关注和深入研究。而在众多客观复杂网络中,网络拓扑结构或者节点的状态在演化过程时,又普遍存在着脉冲、跳