声纹密码技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:misswj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物特征认证技术领域,声纹密码具备快速、便捷、双重加密等优势,在刑侦、安全、经济、生活等各个方向拥有广阔的应用前景。经典的声纹密码系统首先采用语音识别系统对密码内容进行确认,再利用文本无关的说话人识别系统对说话人个性特征进行确认,两次确认策略确保了声纹密码系统的高性能。然而现有的声纹密码系统过多地依赖于语音识别对密码内容的预判决功能,如果冒认者已经获得密码内容,系统错误接收率将显著增加。在此背景下,本文针对冒认者已知密码文本的声纹密码任务,分别在特征域、模型域和得分域进行深入研究和创新,提升了密码文本已知时的系统性能。首先,本文在声纹密码系统特征前端提出特征域偏差估计(FSBE)的信道补偿方法。利用卷积信道噪声在倒谱域表现为线性偏移的现象,传统的CMS、CMVN、双高斯CDF-Matching等信道补偿方法基于单高斯或双高斯特征分布假设,利用各种特征参数归一化方法削弱信道和噪声干扰。相对于传统方法因单高斯或双高斯特征分布假设与实际数据分布不符带来的局限性,本文提出的FSBE方法利用最大化每条测试语音相对于说话人模型和冒认者模型似然度,将测试语音自动投影至目标模型各高斯分量对应的信道空间,训练获得线性或分段线性特征偏移参数。FSBE方法不再依赖参数归一化思想,通过训练获得较好的特征优化效果,也可用作传统信道补偿技术的补充方法。实验验证了特征域偏移估计方法对声纹密码系统信道失配问题具有一定的改善效果。其次,本文对声纹密码系统中说话人模型建模方法进行了研究,提出了高斯混合帧模型(GMFM)的新方法。传统的非参数与参数模型估计方法在密码已知的声纹密码系统中都存在不足之处,前者仅能反映有限注册数据的分布结构,无法描述潜在变化规律以及说话人内部差异,后者在数据稀疏情况下难以获得准确的参数估计,比如GMM-UBM方法中仅调整均值向量不更新协方差矩阵的近似策略导致说话人模型与实际数据分布差异较大,且GMM模型存在忽略文本相关瞬时信息的缺陷。本文结合非参数方法与参数估计方法提出了GMFM建模方法,以每帧训练样本注册一个高斯分量,令每个高斯密度函数的均值向量为对应帧特征向量。为了避免参数估计过拟合的问题,该策略假定所有高斯分量共享少量数目的协方差对角阵,利用最大似然准则进行训练,从而获得较为准确的说话人模型。GMFM方法兼顾了文本相关瞬时信息和说话人内部差异,并且通过绑定方差缓解了数据稀疏的影响,尤其适合短时声纹密码任务。实验表明基于GMFM模型的声纹密码系统相对基线系统获得较大性能提升。再次,本文在声纹密码任务中提出一种基于最小分类错误(MCE)准则的区分性声纹密码模型训练策略。传统区分性训练方法对数据量需求较大,在声纹密码这类短语音任务中难以发挥效用。本文提出的区分性训练新策略将训练集所有说话人的原始特征转换为一种表征其相对于注册模板距离的说话人无关新特征,从而可以集中所有说话人数据组成正例训练集和反例训练集,最终基于MCE准则进行两类区分性训练获得一对通用的正例和反例模型。该策略不仅巧妙地解决了声纹密码任务中区分性训练数据量不足的问题,而且将说话人相关的确认任务转化为说话人无关的经典分类任务,更加灵活有效、节省资源、适合大规模测试任务。实验表明基于区分性模型的声纹密码系统与GMM-UBM系统具有良好的互补性,融合后相对基线系统有明显性能提升。最后,本文引入得分域多维特征分类器方法以增强声纹密码系统的区分能力。传统声纹密码系统直接采用测试语音平均帧得分作为确认判决依据,由于不同类型的语音对目标说话人的区分能力不同,直接赋予所有帧得分相同权重会导致系统性能受损。本文提出的得分域多维特征分类器方法在两种帧分类策略基础上利用各类似然比得分构建得分域多维特征,并选择经典的支持向量机(SVM)方法实现训练和测试。相比于传统声纹密码系统得分域一维特征加阂值的判断策略,新方法引入并定义了合理的得分域多维特征,并辅之以稳定的区分性分类器,将传统的似然比检验策略转换成为多维特征空间上的二类分类问题,进一步提升了声纹密码系统的区分能力和鲁棒性。
其他文献
数字喷泉码(Digital Fountain code, DFC)是一种与信道相关性较小的网络编码,在深空通信、网络通信等领域中都具有潜在的应用价值。数字喷泉码可以改善现行网络传输机制,提高信息
基于布里渊散射的全分布式光纤传感系统能对光纤中的应变和温度进行长距离的连续分布式测量,可应用于大型建筑、公路、隧道、桥梁、大坝、通信光缆、油气管道等的健康状况监
“数字化也许是这个世纪最大的机遇。”这几乎成为这个时代所有领导者的共识。然而,究竟谁能够抓住这个“最大的机遇”并胜出,却是每个管理者都仍在寻找着答案的关键问题。
离双十一还有不到一个月呢,淘宝、京东、苏宁易购、当当、亚马逊等各大购物网站已经在媒体的广告平台上狂轰乱炸,营造出'一年购买季、双十一最优惠'的氛围.在全民狂
期刊
目的 总结分析纤维支气管镜在儿童难治性肺炎肺不张临床诊断与治疗中的应用价值。方法 选取本院2016年7月~2017年9月收治的100例儿童难治性肺炎肺不张患儿,所有患儿采用纤维
<正>《中国新闻传播史(1978—2008)》首发式暨新时期中国新闻改革发展研讨会在中国人民大学召开。全书90余万字,全面系统地论述了1978年—2008年我国新闻传播业的发展变化,对
许多犯人足智多谋、富有魅力、独立、敢于冒险,这些特质给了凯瑟琳将罪犯与企业家联系起来的灵感,Defy Ventures由此诞生。
根据英牙外输管道油品的性质和管道外输现状,运用PIPEPHASE软件分析管道的最大输量和最小输量。通过软件模拟正常输量二下管道的沿程温降和压降,并与实际运行数据进行比对分析,
采用火焰原子吸收光谱法测定镀铬液中镍,镀铬液中的高含量的六价铬通过加入高氯酸和盐酸转化为氯化铬酰气体逸出而去除。在最佳实验条件下,该法测定镍的线性范围为0~4.0μg/m
<正>周围性面神经麻痹也叫贝尔麻痹(Bell palsy),其治疗方法较多,如针灸、星状神经节阻滞、穴位注射、应用激素等治疗,但其治疗效果不一。本文联合应用目前治疗效果较好的三