汉语语音识别技术研究与实现

来源 :天津理工大学 | 被引量 : 5次 | 上传用户：pipijiayoua

【摘要】

：

语音识别技术已经深入人类生活和工作的各个方面，加强语音识别技术的研究，提高语音识别的实用性，对改善人类生活具有重要意义。本文对汉语语音识别技术进行研究，包括噪声环境下的

【作者】

：

贾紫娟

【机构】

：

天津理工大学

【出处】

：

天津理工大学

【发表日期】

：

2013年01期

【关键词】

：

经验模态分解 Teager能量熵矢量量化群智能算法隐马尔可夫

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别技术已经深入人类生活和工作的各个方面，加强语音识别技术的研究，提高语音识别的实用性，对改善人类生活具有重要意义。本文对汉语语音识别技术进行研究，包括噪声环境下的汉语语音切分、预处理、特征提取及语音识别算法。鉴于经验模态分解、Teager能量和熵能够突出体现信号的幅度和频率变化，并且具有噪声鲁棒性的特性，本文将三者结合实现噪声环境下的汉语语音切分。首先进行经验模态分解，滤除噪声，然后对分解出来的固有模态函数计算Teager能量熵，最后通过双门限切分法找出切分点。仿真实验表明该方法切分准确，对噪声具有较强的鲁棒性，并且能够以音节为单位切分汉字，适应汉语语音一个音节表示一个汉字的特点，为汉语语音识别打下基础。为提高汉语语音识别准确率，充分利用矢量量化的压缩特性和隐马尔可夫双重随机过程的语音模型优势，设计一个基于隐马尔可夫和矢量量化的汉语语音识别决策系统，完成语音识别。针对矢量量化中的经典算法--LBG算法容易陷入局部最小解，而且依赖于初始码书选取的缺陷，提出群智能优化矢量量化法的语音识别算法，寻找更加接近全局最优的码书，本文主要开展基于猫群优化矢量量化法的研究，并在仿真实验中实现了猫群、粒子群、蚁群等群智能优化矢量量化方法，提高了语音识别率。通过对汉语语音识别技术的研究，在MATLAB平台上实现了一个小词汇量汉语语音识别系统，验证了新切分算法的噪声鲁棒性和切分准确性，以及改进识别算法的识别准确性。

其他文献

基于超级像素的运动目标检测与跟踪算法研究

近年来，随着“平安城市建设”项目与“科技强警”战略的实施，在我国各个城市都已安装了大量的监控摄像头。通过视频监控，可以在很大程度上减少违法犯罪行为，保障着人们的日常生活

学位

视频监控运动目标检测跟踪算法图像处理超级像素特征提取

直接检测光OFDM系统同步算法研究

随着宽带综合业务数字网的快速发展,以及internet的迅速普及,社会对信息的需求量几乎每半年就翻一番,成爆炸性增长。因此,建设信息高速公路已经成为了世界性的热潮。光纤通信

学位

光纤通信光正交频分复用(OOFDM)直接检测符号定时同步格雷对训练序列

基于压缩感知的混合图像加密算法研究

近些年来,随着网络技术和多媒体技术的迅猛发展,图像传输/存储过程中的安全问题凸显。图像与文本不同,其自身具有大数据量,相邻像素间强相关和能量不均匀分布等特点。在带宽/

学位

压缩感知混沌光学图像加密自适应

基于FRFT的LFM信号检测及参数估计

线性调频(linear frequency modulation, LFM)信号被广泛应用于多种信息系统中，分数阶Fourier变换(fractional Fourier transform, FRFT)可以有效检测线性调频信号，本文从减少

学位

线性调频信号分数阶Fourier变换欠采样信噪比DPTBFGS分数阶自相关信号遮蔽预处理数据量

高动态范围图像显示算法研究

当今信息技术的发展可谓是日新月异，高动态范围图像也就受到了极大的关注。因该图像所表达的信息层次丰富，与普通图像相比更贴近现实世界的光影效果，在各个领域都有广泛的应用。

学位

动态范围图像显示算法工作原理饱和度特征信息

基于神经网络的PCV-2疫苗图像识别算法研究

疫苗的发现可谓是生物发展史上一件具有里程碑意义的事情。因为从某种意义上来说动物繁衍生息的历史就是动物不断同疾病和自然灾害斗争的历史。猪圆环病毒2型（PCV-2）的主要危害

学位

神经网络分形维数分数布朗运动多重分形猪圆环病毒2型

LTE小区搜索算法研究

为迎接WIMAX（全球微波互联接入）等移动宽带通信技术的挑战，保持UMTS（通用移动通信系统）技术在未来十年甚至更长时间内的竞争优势，3GPP于2004年启动LTE（长期演进）技术的标准化工作，LTE

学位

长期演进正交频分复用小区搜索

家庭基站干扰管理技术的研究

家庭基站技术的提出可以有效地解决蜂窝移动通信系统中室内覆盖差和容量低的问题，具有低成本，高服务质量的优点，并且不需要改变核心网。然而它的引入改变了现有网络架构，可能导致

学位

家庭基站干扰管理功率控制频率分配

面向智能图书馆应用的RFID中间件技术研究

智能图书馆是将无线射频识别(RadioFrequencyIdentification，RFID)技术、通信技术、数据库和计算机技术等运用到图书馆中，进而实现图书馆的智能化。RFID技术作为智能图书馆实现

学位

智能图书馆射频识别中间件面向服务架构管理系统

基于图像分割的淋巴癌细胞提取方法研究

恶性淋巴癌也称“淋巴瘤”,是我国常见的十大恶性肿瘤之一。多病发于中、青年,成为威胁人类生命的一大杀手。目前医务人员大部分是通过观察患者的肿瘤切片来人工判断患者的病

学位

细胞分割K均值聚类粘连分割凹点定位

汉语语音识别技术研究与实现

与本文相关的学术论文