基于语音特征空间分布的文本无关说话人识别方法及系统

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:qtedu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备在生活中的广泛应用,自然顺畅的人机交互方式成为人们关注的焦点,身份识别的方式也逐渐由密码等方式向生物特征识别方式转变。说话人识别作为生物特征识别中的一种,利用语音来进行身份识别,具有数据采集方便、用户体验好和识别准确率高等特点,在司法鉴定、远程身份识别和智能家居等场景被广泛应用。说话人识别中,注册过程提取语音的声学特征构建声纹模型,识别过程以待识别样本的特征和声纹模型的匹配评分来进行判决。少量的注册语音难以构建高效的声纹模型,对于文本无关说话人识别,语音的文本内容差异也会对匹配评分造成影响,进而影响识别性能。本文在基于语音特征空间分布的说话人识别框架下,研究降低注册/识别语音文本差异对识别性能影响的方法,主要工作及贡献有以下四方面:1、提出了一种基于语音特征空间分布的说话人识别方法,该方法包括三个步骤:语音特征空间构建、说话人注册(利用语音特征空间计算声学特征序列的空间分布)以及说话人识别(利用语音特征空间计算待识别样本的声学特征分布并进行评分判决)。本方法基于特征空间定位的思想,利用特征的空间分布对声纹进行建模,实现了说话人区分信息表达和轻量样本注册,并且训练数据容易获取。2、验证本方法的可行性,在400个说话人的语料库上本方法可以达到0.90的识别准确率。对本方法的实现及方法的优势进行理论分析和实验探究,包括语音特征空间的构建方案、特征邻域的选择、关联度的定义、语音时长对性能的影响和语音特征空间的共享性等。3、提出了两种降低注册/识别语音文本差异对说话人识别性能影响的策略。一是利用线性判别分析方法对特征分布矢量进行变换处理,降低语音文本内容对说话人特征的影响,在400个说话人的语料库上识别准确率达到0.95。二是设计包含全部韵母的最小注册文本,提升注册文本的声纹特征空间覆盖率,减小识别样本与注册样本的空间失配的概率,达到提升说话人识别性能的目的。结合两种策略进行实验研究。4、实现了一个文本无关的说话人识别系统,系统包含用户注册、声纹模型存储和用户识别等功能,提供了用户注册与用户识别的模块函数用于二次开发。在真实环境下测试系统,本说话人识别系统具有较高的已注册用户识别准确率和未注册用户检出率。向用户提供系统的使用说明。
其他文献
直线是日常生活中常见的一种几何结构,通常会出现在物体的边缘,直线结构可以反映出图像最基本的结构框架,为进一步图像处理工作提供了重要依据。当前,直线检测算法层出不穷,
当前,能源成本的增加和移动通信使用的增长这两个无可争辩的趋势交集,迫切要求解决节能通信的发展问题。无线网络技术将在全球范围内降低能源消耗的“绿化”工作中发挥重要作
锂离子二次电池因为其高容量、环保、循环寿命长等特点被广泛的应用在便携电子设备中。但是目前商用的石墨类负极材料已经渐渐不能满足人们对于锂离子电池更高容量、更好的安全性能、更高功率性能的要求。因此对于新型负极材料的研究和开发成为一个重要的课题。目前研究比较多的合金类以及过渡金属氧化物类负极材料有着导电性差、体积膨胀严重等问题严重影响其循环稳定性。本文主要研究了一种新型的碳包覆改性方法,针对二氧化钛(T
光学元件表面存在疵病,会导致光学系统的性能下降,因此在实际的加工、组装环节,元件的疵病检测至关重要。目前针对表面疵病的检测主要有散射能量法和成像法两大类,散射法的优
本文主要研究了基于回归模型和时间序列模型的拟数据删除方法的统计诊断。首先介绍了线性模型基于数据删除模型的诊断方法,其次针对误差相关的回归模型和时间序列模型提出了拟数据删除模型,然后证明了当回归模型的误差是独立的时候,拟数据删除模型和数据删除模型在回归参数估计上的渐近等价性,最后通过实例分析和仿真模拟,说明拟数据删除方法的有效性。
中国的钢铁行业是“去产能”的重点行业,须在2016到2020年的4年间淘汰11.5亿吨粗钢产能。由此造成的多余装备制造能力、二手装备、产业资金和专业人才都需国外市场和海外投资项目承接。中国钢铁行业于2017年初成立了国际产能合作企业联盟(简称“Z联盟”)。本文从该行业联盟的高度,为所有成员构建了一个符合本行业海外投资项目实际情况的风险评价框架,并且将该框架在一个莫桑比克钢铁项目的尽职调查中进行了实
评分规则是有氧踏板比赛评判的依据,也是衡量运动员成套动作的标尺,规则的修订对有氧踏板项目的发展起着方向性的引导作用。自有氧踏板项目列为世锦赛比赛项目以来,有氧踏板
随着科技的发展和社会的进步,三维形貌测量在工业和生活中的应用越来越广泛。数字条纹投影技术因其无接触、快速、高精度等优势在工业检测、虚拟现实及生物医学等领域有着广
全球每年因水稻真菌病害造成的损失高达数十亿美元,因此水稻真菌病害早期检测成为国内外研究热点。目前,国内外广泛采用卫星遥感、光谱法、核酸法等检测水稻真菌病害,但上述
我国北方平原地区,在河渠上修建了大量拦河闸(节制闸)和蓄排兼用水闸,除了行洪、排水期间,大部分多孔水闸经常出现少数孔小开度开启运用的情况,导致主流在闸后扩散不充分,水流流态复杂,出现二次水跃,冲刷下游河(渠)道,从而威胁到水利工程的运行安全。实际工程中,消能工往往工程量较大,费用较高,鉴于此,拟在闸后消力池设置一种体型较小且造价经济的新型辅助消能工——交错式挡坎,它通过反击作用消能并将主流分散成多