基于听觉感知模型和统计学习的语音鲁棒处理

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:fengpose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要目的是研究语音鲁棒处理技术,提高噪声环境中语音切分的鲁棒性,然后在此基础上具体实现语音库建设辅助工具.该文首先基于人类的听视感知模型,研究了语音信号的时频分析方法,构造了满足听觉感知模型的非均匀完全重构滤波器组,完成了基于最大似然估计的子带语音去噪算法,实现了基于MDL(最小描述长度)的自适应平滑子带语音鲁棒端点检测算法;其次讨论了基于隐马尔可夫模型语音切的缺陷,指出了韵律因素对语音切分的影响,提出了语音鲁棒切分的贝叶斯框架;最后描述了标注图的主要思想,提出院了基于XML的语音标注体系结构,并利用可扩展标注语音XML、Visual Basic和SQL实现了语音库建设辅助工具的原形系统,具体标注了孤立数字语音库、边疆数字串语音库和用于说话人识别的特殊语音库.
其他文献
本文设计了一种基于DSP的直流无刷电动机伺服控制系统。根据伺服系统对快速性、高精度以及传动的刚性和高的速度稳定性等方面的性能要求,系统采用了位置、速度、电流三闭环的控制结构。 位置控制环为最外环。为了兼顾位置伺服控制的快速性和精确性,在本环节设计了一个模糊控制器。模糊控制器可以根据位置误差的大小以及位置误差变化率的大小,实时的调节电动机的转速,使系统在大的位置偏差的情况下能够以最快的速度向着
学位
该文以长丰集团计算机集成信息管理系统(CIMS)的实现为背景,研究了JIT生产管理方式下看板管理的实现,并针对看板管理对需求不稳定变化的响应不好的情况加以分析,给出了相应的
随着人类活动空间的迅速扩散,航天任务的需求也越来越多,从而空间环境对航天器的芯片和核心器件的影响也越来越被人类所重视。在这几十年的航天活动中,人类发现在航天器的轨道上
该文针对移动机器人视觉图像处理算法、控制的软件平台设计与开发问题开展研究工作.该文首先对移动机器人技术、移动机器人视觉系统及移动机器人控制的软件平台的研究概况进
该文的研究重点是医学影像的分割方法.由于成像设备和手段的不同,与其他影像相比,医学影像具有形状复杂多样、个体间差异大、信号不均匀、边缘模糊、多噪声等特点,因此医学影
学位
由于计算机技术、控制技术和通信技术的飞速发展,对工业自动化软件的功能提出了新的要求。工业自动化软件要在信息采集、加工的基础上,运用网络和数据库技术,实现信息集成,从而进
随着工业控制要求的提高及控制理论与计算机技术的发展,产生了控制效果好、鲁棒性强,适用于控制不易建立精确数学模型且比较复杂的工业过程的预测控制算法,并已在石油、化工、冶
开发一个带多种外围设备的嵌入式系统,如果选择通用串行总线(USB)——一种具有标准连接口,标准协议和标准连接线的通用协议,作为设备接口的话,将大大提高整个系统的稳定性和整体性。 本文详细介绍了在嵌入式场合需要考虑的USB的一些基本特性,重点介绍了怎样在嵌入式场合应用USB大容量存储类设备,并且给出了相应的开发方案。 我们选择没有驱动程序架构和文件系统组件的最简单的嵌入式实时操作系统uc