基于线谱对系数和高斯混合模型的说话人识别技术研究

被引量 : 0次 | 上传用户:ontheroad2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展和对信息安全的日益迫切需求,基于生物特征的个人身份识别技术也得到了飞速发展。说话人识别是生物识别的一个分支,随着近年来现代电子技术的高速发展,正以其独特的方便性、经济性和准确性等优势受到世人瞩目,是当前安全认证系统研究和发展的必然趋势。本文对小规模文本无关说话人识别的理论和技术进行了系统的研究。针对清浊音的不同特性采用多尺度分段小波去噪,较完整的保留了语音的频谱特性。使用自适应双门限法进行端点检测,能根据不同的语音环境做自适应变化,提高了端点检测性能。线谱对LSP(Linear Spectrum Pairs)系数具有良好的动态范围和滤波稳定性,以及良好的内插特性和量化特性,并能良好的表征说话人语音中的共振峰信息,能更好地提取语音信号中隐含的音谱特征,本文分析了其频谱特性,并与现有的主要说话人特征进行了性能分析和比较,证明LSP参数具有良好的说话人特征提取性能。同时针对GMM模型的EM算法使用k-Means聚类法进行了优化,提高了系统训练模型的性能。本文将LSP系数和GMM模型相结合建立了文本无关说话人识别系统,实验表明,该系统具有良好的性能和实用性,当信噪比为20dB至40dB时,识别率可达90%以上。
其他文献
根据现代分子生物学知识和微生物知识,认为基因重组方式可能是人类进化的一种主要方式;并认为微生物能通过基因重组有效介导自身基因和各种生物基因流向人类;从原核生物到真核生
不久前有幸参加了中国电视金鹰奖电视剧的评审,集中观看了80多部来自全国各地的优秀电视剧,感慨良多。这些电视剧生产于2004年-2005之间,有的在中央台播出,有的在地方台播出,有的
伴随着时代的快速发展,中国的科技水平也在持续加强,人们对信息的需求也在慢慢的加强,而计算机网络技术可以在一定限度上加强广播电视节目的品质和能力,提高广播电视业的拓展
群众利益无小事,小事连全局,小事连民心。要完成维护稳定这个硬任务,根本的一点就是一切要从人民的利益出发,为人民服务,让人民满意
亚里士多德关于幸福阐述主要在《尼各马可伦理学》一书中,他关于幸福观的探析也是自成一派。讨论幸福问题不可避免地涉及快乐问题,文章中按照亚里士多德幸福观的阐述思路,首
本文选取2000~2014年乌鲁木齐市历年统计数据,通过运用Eviews计量统计软件进行回归分析,并计算主要产业对GDP的贡献率,分析结果表明:第三产业在乌鲁木齐市经济发展中的作用日
客运索道是一种能跨山、越河、适应各种复杂地形的运输工具,同时还具有游览、观光的作用,是森林公园和各种风景游览区一种理想的输送游客的交通工具。客运索道在运行中较其它
技术建构论是兴起于20世纪80年代的技术哲学研究思潮。它主张技术的产生与发展在很大程度上取决于相关社会团体的解释框架,取决于社会对它的选择作用,技术的发展在整体上是处
过去十多年的发展中,郴州市烟草公司始终勇于改革,锐意进取,在深化内部改革,提高自身经营能力方面取得了较为喜人的成绩,为企业未来的发展奠定了良好的基础。2003年的全国烟