汉语语音识别技术研究与实现

来源 :天津理工大学 | 被引量 : 5次 | 上传用户:pipijiayoua
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术已经深入人类生活和工作的各个方面,加强语音识别技术的研究,提高语音识别的实用性,对改善人类生活具有重要意义。本文对汉语语音识别技术进行研究,包括噪声环境下的汉语语音切分、预处理、特征提取及语音识别算法。鉴于经验模态分解、Teager能量和熵能够突出体现信号的幅度和频率变化,并且具有噪声鲁棒性的特性,本文将三者结合实现噪声环境下的汉语语音切分。首先进行经验模态分解,滤除噪声,然后对分解出来的固有模态函数计算Teager能量熵,最后通过双门限切分法找出切分点。仿真实验表明该方法切分准确,对噪声具有较强的鲁棒性,并且能够以音节为单位切分汉字,适应汉语语音一个音节表示一个汉字的特点,为汉语语音识别打下基础。为提高汉语语音识别准确率,充分利用矢量量化的压缩特性和隐马尔可夫双重随机过程的语音模型优势,设计一个基于隐马尔可夫和矢量量化的汉语语音识别决策系统,完成语音识别。针对矢量量化中的经典算法--LBG算法容易陷入局部最小解,而且依赖于初始码书选取的缺陷,提出群智能优化矢量量化法的语音识别算法,寻找更加接近全局最优的码书,本文主要开展基于猫群优化矢量量化法的研究,并在仿真实验中实现了猫群、粒子群、蚁群等群智能优化矢量量化方法,提高了语音识别率。通过对汉语语音识别技术的研究,在MATLAB平台上实现了一个小词汇量汉语语音识别系统,验证了新切分算法的噪声鲁棒性和切分准确性,以及改进识别算法的识别准确性。
其他文献
近年来,随着“平安城市建设”项目与“科技强警”战略的实施,在我国各个城市都已安装了大量的监控摄像头。通过视频监控,可以在很大程度上减少违法犯罪行为,保障着人们的日常生活
随着宽带综合业务数字网的快速发展,以及internet的迅速普及,社会对信息的需求量几乎每半年就翻一番,成爆炸性增长。因此,建设信息高速公路已经成为了世界性的热潮。光纤通信
近些年来,随着网络技术和多媒体技术的迅猛发展,图像传输/存储过程中的安全问题凸显。图像与文本不同,其自身具有大数据量,相邻像素间强相关和能量不均匀分布等特点。在带宽/
线性调频(linear frequency modulation, LFM)信号被广泛应用于多种信息系统中,分数阶Fourier变换(fractional Fourier transform, FRFT)可以有效检测线性调频信号,本文从减少
当今信息技术的发展可谓是日新月异,高动态范围图像也就受到了极大的关注。因该图像所表达的信息层次丰富,与普通图像相比更贴近现实世界的光影效果,在各个领域都有广泛的应用。
疫苗的发现可谓是生物发展史上一件具有里程碑意义的事情。因为从某种意义上来说动物繁衍生息的历史就是动物不断同疾病和自然灾害斗争的历史。猪圆环病毒2型(PCV-2)的主要危害
为迎接WIMAX(全球微波互联接入)等移动宽带通信技术的挑战,保持UMTS(通用移动通信系统)技术在未来十年甚至更长时间内的竞争优势,3GPP于2004年启动LTE(长期演进)技术的标准化工作,LTE
家庭基站技术的提出可以有效地解决蜂窝移动通信系统中室内覆盖差和容量低的问题,具有低成本,高服务质量的优点,并且不需要改变核心网。然而它的引入改变了现有网络架构,可能导致
智能图书馆是将无线射频识别(RadioFrequencyIdentification,RFID)技术、通信技术、数据库和计算机技术等运用到图书馆中,进而实现图书馆的智能化。RFID技术作为智能图书馆实现
恶性淋巴癌也称“淋巴瘤”,是我国常见的十大恶性肿瘤之一。多病发于中、青年,成为威胁人类生命的一大杀手。目前医务人员大部分是通过观察患者的肿瘤切片来人工判断患者的病