文本独立的语者识别技术的研究与应用

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:wfdzdb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语者识别又称声纹识别,是根据语者的语音对语者身份进行辨认或确认的技术。伴随着计算机和网络信息化技术的高速发展,身份验证的数字化、隐性化、高效化和便捷化显得越来越重要,说话人识别作为一种生物认证技术,由于其凸显出的隐性化和简单等优点,在语者监控、身份验证、金融安全及司法刑侦等领域有了越来越多的应用,是当前语音信号识别领域的研究热点。说话人识别技术研究的关键是语音信号的特征提取和模式匹配等问题。其中语音前处理以及特征提取和优化部分尤为重要,其结果直接影响说话人识别系统性能好坏。论文主要研究内容如下:(1)归纳总结说话人识别技术的原理、发展与现状、研究热点与难点,介绍了目前用到的语音特征和模式匹配方法。(2)研究了当前语音和语者识别用到的语音特征,对其辨识力鲁棒性等多个方面的性能进行实验,筛选合适的语音特征并进行特征融合。本文中选择了相关度不高的SCF和MFCC特征进行帧级别的合并,得到的混合特征再与SCM特征进行打分级别的合并。(3)在说话人识别系统的鲁棒性研究问题上,着重对说话人识别系统的前端输入语音前处理和产生的语音特征后处理进行了研究,以解决加性噪声和电话信道带来的训练识别语音不匹配问题。对加性噪声引起的不匹配,对语音增强技术及其改进技术进行了实验研究,选取合理的方法作为前端去噪方法。对电话信道带来的不匹配问题,对比各种特征域规整化技术的效果。(4)搭建了一个具备鲁棒性的完整文本独立语者识别系统,前端基于卡内基梅隆大学的sphinx语音识别系统,对其预处理和语音增强部分、特征提取部分以及特征规整化处理进行改进。后端使用java完成在线和离线训练,在线识别,以及识别率测试等功能。并对系统进行了测试,验证设计的合理性和功能的完善性。
其他文献
本试卷分第一卷(选择题)和第二卷(非选择题)两部分,满分150分。考生注意:1.答题前,考生务必将自己的学号、姓名等项内容填写在答题卡上。2.第一卷每小题选出答案后,用2B铅笔
详细阐述了寒地玉米田套养商品鹅种养结合模式下玉米品种的选择、 田间管理等玉米种植技术以及套养鹅品种选择、养殖密度等技术要点;从载畜量及玉米地饲养分区,经济效益、社
本试题卷分选择题和非选择题两部分。时间150分钟,满分300分。第Ⅰ卷一、选择题:本题共35小题,每小题4分,共140分。在每小题给出的四个选项中,只有一项是符合题目要求的。下
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,满分300分。考试时间150分钟。第Ⅰ卷(选择题共126分)一、选择题(本题共13小题,每小题6分,在每小题给出的四个选项中,只有
随着雷达和通信系统的迅速发展,人们对新一代频率合成器和频率合成方案都提出了更高的要求。在现代雷达、武器制导和电子系统等领域,具有高指标的频率合成器往往决定了该领域的
随着Internet的飞速发展,互联网上的信息量呈爆炸式发展,Web网页中存放着涵盖各个领域的大量有价值的信息。现阶段对网站分类需要处理大量的数据,正确率却不高,类目的设置也
在现阶段的网络建设中,室内覆盖不足和网络容量瓶颈正在成为制约下一代网络发展的两个重要问题。家庭基站网络技术的出现,可以很好地解决未来B3G/4G网络中室内覆盖优化和网络容
昆虫脑内胆碱能系统在中枢神经系统中起着重要作用,参与感觉、运动、学习、记忆等生理活动,与昆虫的复杂行为密切相关,一直以来就是科学研究的热点问题。胆碱能系统中存在两类重
随着移动通信技术的快速革新以及GPRS(GeneralPacketRadioService,通用分组无线业务)网络的发展,移动通信数据业务种类和业务量也迅速增加。随之而来的是移动网络规模的日趋复