基于文本无关的说话人识别技术的研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:colawind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在实际生活中,身份认证应用在各个领域,身份认证的方法有很多种,比如指纹、虹膜、人脸等等,声纹识别也是其中一种,又叫说话人识别,是通过说话人的声音辨识出说话者身份。说话人识别又分为与文本相关的和与文本无关的,本文主要研究与文本无关的说话人识别技术,因为其更具有使用价值,并且提升空间比较大。通过对其关键技术的研究,以提高系统识别性能。本文在现有与文本无关的说话人识别技术的基础上,结合语音学、音韵学及其语音信号的特征,研究基于文本无关的说话人识别关键技术。主要的研究内容包括以下几个方面:清浊音划分。在对语音信号排除静音信号基础上,针对过零率划分清浊音方法,在处理振幅均值不在零点的信号时失效的问题,提出了有效翻转率方法;又针对清、浊音有效翻转率相似部分,运用频谱振幅均值方法区分清浊音。基音周期检测。在对语音信号静音、清音、浊音划分的基础上,针对语音信号周期特征明显段分布随机性问题,提出改进的LVAMDF(变长度平均幅度差函数法)及综合多因素基音检测算法,该算法对语音信号进行周期特征明显段和周期特征不明显段的聚类划分,同时,获取周期特征明显语音段的所有基音周期的起止端点,针对少数基音周期划分倍频或半频问题,提出识别、修正方法,其识别、修正率极高。与文本无关的说话人识别系统。根据与文本无关的说话人识别系统原理,运用matlab和C++混合编程,完成说话人识别系统和系统测试,系统的等错误率可达0.4762%。基于音素分类的说话人识别系统理论研究。在TIMIT语料库的音素标注基础上,运用混淆矩阵原理,研究了不同说话人不同发音特征的相似性和差异性,从而以强调差异性避开相似性的方法提高系统性能。该部分完成了部分理论研究和部分功能实现。本文提高了系统2处关键技术的性能,完成了与文本无关的说话人识别系统的功能,最后提出了系统识别原理的改进方案。由于工作量较大,改进方案还需完善和验证,系统性能还需要从音素识别、特征提取和系统原理方面进一步提升。
其他文献
本文提出了一种基于LUT的FPGA的时序分析方法和后仿真设计方案,并予以实现。在时序分析阶段,从FPGA芯片结构和电路的布线信息中抽象出时序节点和时序边来构造时序图,根据时序
计算理论是计算机软件理论领域的基石。它的发展直接影响计算机科学家今天的工作。图灵机是自动机发展的高级形式,是迄今为止模拟能力最强的计算模型,但是其结构特点不便描述
故障预报和预警是20世纪后期才发展起来的一个新兴的研究方向,也是当前预测控制理论研究的热点之一。随着对系统可靠性和安全性要求的进一步提高,人们希望能够在故障对系统的危
随着信息技术的发展和网络应用的不断深化,网络安全的形式也日益严峻,与此同时,网络安全的概念也不断的深化、拓延。如何有效保护重要的数据信息、提高计算机网络系统的安全
植物叶片几何参数的测量可用于监测植物的生长状况,有利于指导农业生产和农学或植物生理学的研究。传统对植物叶片几何参数进行测量的手段有九宫格法、称重法、系数法、叶面
单一功能的嵌入式产品越来越不能满足人们的需求,比如,单纯照像功能的数码相机,单纯音乐播放功能的MP3以及单纯语音通话功能的手机也将会被功能更加强大的产品所替代。除了电
在当前的互联网时代,随着终端设备和移动互联网的不断发展,用户可以便利的获取和发布视频,与此同时,随着各种视频处理软件不断增多,用户可以方便地对视频进行各种操作,例如编