基于深度学习的说话人识别技术研究

被引量 : 0次 | 上传用户:ll19870627
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别通常称为声纹识别,是一种身份认证技术。它具有用户接受度高、所需设备成本低、可扩展性好以及便于移植等优势,可广泛应用于国防军事、银行系统、通信、互联网、公安司法等领域。说话人识别技术已经取得重要进展,并有产品问世,但尚有许多问题有待深入研究。深度学习是近年来发展起来的一种神经网络模型,它具有克服学习不充分、深度不足等特点,可用于模式分类、目标跟踪等领域。本文将深度学习理论用于说话人识别中,从基于深度学习的说话人识别系统、改进特征的说话人识别算法、改进统计准则的说话人识别算法三个方面,对说话人识别技术进行了研究,主要工作如下:(1)基于深度学习的说话人识别系统的性能研究。将深度学习理论引入到说话人识别系统中,在此基础上分析了测试语音不同单位长度对说话人识别率的影响;在相同测试条件下,不同语音特征参数对说话人识别准确性的影响;在相同条件下,不同的深度学习层数以及层上节点数对于系统识别率的影响,证明了深度学习在说话人识别系统中应用的正确性与可靠性。(2)基于改进特征的说话人识别算法。本文将模拟人耳听觉特性的MFCC与GFCC语音特征参数结合起来,组成语音特征向量,并应用于说话人识别系统中,提高了系统识别率。(3)基于改进统计准则的说话人识别算法。考虑到传统的系统统计识别算法对于多个说话人识别时存在潜在的误判,本文应用分帧概率打分的统计准则,并进行了说话人识别实验。实验仿真验证了改进统计准则的可行性与有效性。
其他文献
测井曲线的质量易受井眼环境因素的影响,井径扩径段井壁凹凸不平、泥浆侵入、泥饼等容易造成曲线畸变失真,特别是探测深度较浅的密度和声波时差曲线。笔者利用曲线之间的内在
自从进入二十一世纪以来,中国汽车市场一直保持着较高、较快的的增长速度。2013年中国汽车的产销量均超过2000万台,中国正式超过美国,成为全球第一大汽车产销市场。全球各大
近年来,由于内蒙古地区经济的发展,社会的进步促使牧区房屋的建设较为迅速。由此,随着生活方式的变迁,内蒙古牧区的典型传统居住形式—蒙古包,已逐渐被人们遗忘。取而代之的
当前,基层消防部队训练科目较多,强度较大,在训练过程中,时常有人员受伤的情况发生。本文就基层消防部队在开展训练过程中如何有效避免训练损伤提出了一些自己的见解。
岩爆是坚硬脆性岩体在高应力集中区发生的,源于弹性能突然释放,伴有可感知声响,以动态弹射或崩溃抛掷破坏为典型表现形式的特殊地压显现。岩爆发生机理研究,特别是岩体岩爆倾
目的检测自噬相关基因Beclin1、LC3和多药耐药基因LRP、GST-π、TopoⅡ在大肠癌中的表达,探讨自噬对大肠癌多药耐药性(multidrug resistance,MDR)的影响。方法应用免疫组化En
蛋白质和多糖是构成食品体系的两类重要的高分子材料,也是决定食品微观结构、质构特性和感官特性的重要因素,故而蛋白质和多糖的相互作用研究一直是食品科学的研究重点。本研
酚醛环氧防腐涂料在石油化工领域应用越来越广泛,本论文依据石油钻杆内涂层的行业标准SY/T0544-2010《石油钻杆内涂层技术条件》的技术标准,研究制备了一种新型的酚醛环氧防
计算机辅助药物设计是多学科相互交叉渗透的领域,它以计算机为基础,模拟和计算配体小分子与受体大分子之间的关系。计算机辅助药物设计的手段十分丰富,包括药效团模型、分子
农村劳动力向非农产业和城镇转移,是我国现代农业发展的客观需要,也是农民脱贫致富主观愿望的体现。然而,随着经济和科技水平的快速提高,非农产业对劳动力的素质要求也越来越高,致