基于识别的藏语音节特征提取

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:cupzss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别在当下是研究的热点,语音识别是涉及语音语言学、计算机科学、信号处理、生理学、心理学等众多学科的一门交叉学科,也是模式识别和人工智能领域的重要分支,然而藏语语音识别的研究却相当滞后,本文主要介绍藏语的单音节预处理和特征提取的方法。预处理过程在语音识别中起着至关重要的作用。对于藏语语音识别的预处理研究借鉴的是英语单音节的语音处理方法,在语音识别系统中正确的判定输入语音的起点、终点对于提高识别率是非常重要的。对于短时瞬态信号、非平稳过程信号、含宽带噪声信号采用传统方法处理有着明显的局限性,在高信噪比情况下,滤除噪声是很容易的,用短时能量幅度与短时平均过零率可以获得较好的检测结果。首先总结一下倒谱特征参数的优点,倒谱特征参数不仅可以体现原始信号的特征,而且对于谐波或者噪声几乎可以有很明显的区分,具有很好的鲁棒性和稳定性,所以现在的语音识别几乎都是用的倒谱来实现的。在语音识别系统中用倒谱是比较有优势的。这篇文章采用几种方法的综合处理可以准确率较高的确认识别语音的端点,并能在低信噪比情况下滤除噪声,识别清浊音。实验证明了此种方法不仅正确,而且提高了检测的准确度。特征提取是尽可能的保留那些对识别有效的信息,同时最大限度的去除哪些无用的、冗余的信息。由于语音处理技术在很多方面都有要运用,而且在语音识别系统中,最关键的是语音特征参数的提取。做语音识别时,最后的识别结果与预处理有关,更重要的是信号的特征参数,它直接决定识别结果。在语音信号处理中,语音信号特征提取是非常重要的。本文开始对基本知识做了认真的研究,主要是在语音信号处理,语音识别技术,还有最基本的原理。对于LPCC来说,特征参数跟背景噪声有很大的关系,因为线性预测倒谱对噪声的相应是非常敏感的,梅尔倒谱系数就不受噪声的影响。自然对于本文来说,为了更具说服力,我们对含有噪声的语音信号进行研究处理。因为在较短的时间间隔中,语音信号的时域特征可基本保持不变,这是研究语音信号能有成果的基础,本文利用梅尔倒谱系数对单音节藏语进行特征提取。
其他文献
随着信息技术及多媒体技术的迅速发展,人们获得的诸如图像、视频等信息也越来越多。图像识别在最近几年已经被广泛研究与应用,而人脸识别在其中占有非常重要的地位,其在身份
生物特征识别技术因其稳定性、唯一性、便携性、安全性等优势使得人们相信不久的将来将逐步地取代传统的身份认证方式。掌纹作为一个重要的生物特征,在过去的十几年中已经吸
近年来,随着对等网络(Peer-to-Peer,P2P)规模、信息量和用户量的飞速增长,P2P技术成为人们研究与关注的焦点。在P2P网络中,节点既是客户机,享用其他节点提供的服务,同时又充当服务
航空发动机是飞机、飞艇等航空装置的动力提供设备,主轴轴承作为航空发动机的重要组成部分,长期在高温、高压、高转速等复杂条件下运行,对航空装置的飞行安全起着至关重要的
信息技术(Information Technology,IT)与业务的不断融合、体系架构的不断完善,迫切要求对IT业务及其实现支撑业务的IT资源进行适当的管理,使之符合企业业务运作的需要并保证
非平衡数据分类问题广泛存在于现实世界中,如医疗诊断、雷达图像监测、诈骗检测等。由于其固有的不均匀特性,即正负样本数目相差悬殊,导致了传统的分类算法的有效性降低。因
创建逼真的三维人脸模型一直以来都是计算机图形学领域一个极具有挑战性的课题。人脸建模和表情动画作为虚拟现实技术和计算机图形学的一个分支已有30多年的历史。同时随着多
Web作为一个全球化信息空间,蕴含着巨大的潜在价值,如何在庞杂的数据中准确地抽取出用户想要的信息成为一个非常重要的课题。尽管目前已对Web数据抽取技术进行了大量的研究工
VPN技术是通过公共网络建立虚拟专用网络的一种网络接入方式。VPN使用了隧道技术、加解密技术、密钥管理技术和身份认证技术保证了其系统的安全性,使得它成为当前主流网络技术
传统的无线传感器网络有着广泛的应用前景。然而,由于传统无线传感器节点体积相对较大,在一些场景中无法应用,比如体内监测。由纳米级大小的无线传感器构成的无线纳米传感器