论文部分内容阅读
随着智能手机和移动互联网的飞速发展,传统密码难以满足用户对信息安全可靠性与便捷性的需求,以声纹识别为代表的数字化生物认证技术成为当前人工智能领域的研究热点。随着Android的快速普及,基于移动终端的声纹识别系统在数字化安全认证方面有着广阔的应用前景。但声纹识别技术应用在系统资源有限的Android平台中面临实时性和鲁棒性较差的问题。本文重点针对上述问题集中在以下几个方面进行研究:研究了语音信号特征提取算法。针对传统MFCC(Mel Frequency Cepstrum Coefficients)特征提取算法在Android平台计算时间较长,在噪声环境下鲁棒性较差的问题,本文通过结合其一阶与二阶差分,得到一个改进结构的系数组合,并结合Android平台特点,提出了特征提取的多线程并发算法,将特征提取任务分解成n等分,对应启动n个子线程并发计算。将改进后的特征系数应用在Android平台,等错误率降低了7.24%,识别率提升了6.8%,噪声环境下的鲁棒性也得到了显著提升。在加入3个子线程后,特征提取计算时长缩短了约35%。研究了语音特征矢量模式匹配算法。针对传统建模与匹配算法不适用于说话人辨认系统在移动平台的本地实时应用问题,本文提出一种DTW(Dynamic Time Warping)结合GMM(Gaussian Mixture Model)的动态门限双层模式匹配算法。在第一层采用DTW算法对模型库进行快速初筛,缩小匹配范围,第二层采用GMM模型精确匹配做出最终的判决。该算法在没有过多损失识别精度的前提下,比传统GMM模型匹配法计算时间缩短了约41%-55%,比传统DTW匹配算法准确率提高了约12%-14%,并根据注册模型数目动态调整初筛门限,在最短的时间内获得最高的准确率,实现移动终端的实时应用。设计并实现了一种应用于工业自动化领域的Android声纹识别系统。针对当前产线中Android设备音频功能测试自动化程度较低的问题,本文提出一种基于声纹识别技术的Android设备音频故障诊断系统。采用MFCC及其一阶差分作为特征系数,通过DTW算法对麦克风录制语音和扬声器播放语音的特征模型进行比对,实现扬声器与麦克风同步对无声、失真、杂声、失衡等多种故障进行全面检测。不同类型故障识别率从100%到93.33%不等,相比人工测试效率提高6.25倍,初步预估为企业带来显性效益超90kUSD/年。通过与其他文献的横向对比,证明了本方案在故障诊断类型与低成本方面具有显著优势。