基于矢量量化的说话人识别分析与研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:Jingle2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是生物认证技术的一种,是根据语音波形中反映的说话人生理和行为特征的语音参数自动鉴别说话人身份的技术,有着广阔的市场应用前景。本文研究的是基于矢量量化方法的说话人识别。本文首先对语音信号的特征参数进行分析,重点研究了线性预测系数、线性预测倒谱系数、Mel频率倒谱系数的基本原理和提取方法。接着重点研究了基于矢量量化的说话人识别方法,针对LBG算法的码本设计,提出了一种新的初始码本生成算法;在匹配判决上,提出了基于标准差描述的加权欧氏距离失真测度。在实验测试中,得出加权MFCC参数是性能较为优良的特征参数,能够保证系统有较高的识别率;验证了码本生成算法的正确性和可靠性,并且考察了码本尺寸对系统识别性能的影响;测试了特征参数加权与识别方法加权两种不同加权策略,对系统的性能均有所改善。最后在Matlab下设计了与文本无关的说话人辨认系统平台,在10个说话人的语音库上作了测试,得到了较高的识别率。
其他文献
语义网是当前万维网研究的热点之一,它是人们对于未来智能化互联网络的伟大设想。自语义网的概念在1998年由互联网之父Tim Berners-Lee提出以来,语义网的理论研究,特别是在语
随着信息技术的不断进步和计算机网络的迅速发展,众多应用领域如网络安全、股票分析、电子商务、气象监控等产生了大量的数据流,其中蕴含着丰富的有价值的知识亟待挖掘。作为
井下机车无人驾驶系统可以减少井下工作人员数量,有效避免因调度、操作失误而发生的运输事故,具有巨大的社会效益和经济效益。可靠的无线数据传输是实现无人驾驶的前提,本论
现代信息系统已经被广泛使用于各行各业,每刻都产生着大量的数据。在这海量的数据背后蕴藏着丰富的有价值的信息,需要有相应的机制和系统来发现和提取。复杂事件处理机制(Com
多目标优化是优化领域的主要研究方向之一,现实中的优化问题大多具备多个相互冲突的目标。不同于单目标优化问题有唯一的最优解,多目标优化问题的最优解为一组折中解,即Paret
为了能够更好地理解互联网内部的动态行为及其相关因素,建立有效的BitTorrent网络用户行为模型意义重大。BitTorrent网络用户行为模型对于分析和预测网络性能,从而更好地完成
开关磁阻电动机具有结构简单、起动性能好、调速范围宽、运行效率高等特点,由其构成的开关磁阻电动机调速系统具有较强竞争力,在低压和小功率的应用场合,大大优于普通的异步电动机和直流电动机调速系统,目前已引起了国内外学者的普遍关注和深入研究。本课题设计开发了一套7.5KW开关磁阻电动机调速系统。选取TI公司的TMS320F2812型号电机控制专用DSP芯片作为主控制器,进行了系统软硬件的设计、仿真、制作及
当前,多媒体技术正在飞速发展,世界各地每时每刻都在产生新的数字视频。借助于互联网,这些丰富的视频资源在几乎无约束的情况下复制、传播,高效的视频内容管理和版权保护是个
随着软件行业的飞速发展,设计模式已经成为软件工程领域研究的一大热点。设计模式可以用来解决软件设计过程中重复出现的问题,使用设计模式可以有效提供软件的可复用性,可靠性和
近年来,校园“一卡通”逐渐成为校园内信息交互的重要载体,它在身份识别、电子钱包、考勤等方面得到了广泛应用。东华大学教职员工可凭校园“一卡通”刷卡搭乘校区间班车,学