基于因子分析和支持向量机的耳语说话人识别

来源 :苏州大学 | 被引量 : 0次 | 上传用户:ntudqliweiwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音说话人识别在公共场合下的通讯,安全场所的身份鉴定以及罪犯识别,电话网络查询与电话银行等领域都有着广泛的实用价值。耳语音的说话人识别技术在日常生活中越来越被重视。由于耳语发音方式的特殊性,耳语音说话人识别受说话人的健康状况、心理变化、发音状态和信道环境等因素的影响尤为突出。用正常音建立的说话人识别系统应用到耳语音,识别性能将大为下降。联合因子分析(JFA)在不匹配信道环境下耳语说话人识别已经取得了很好的效果,它能够从模型方面分离出说话人和信道信息,从而进行信道补偿。本文只采取了联合因子分析方法中的一部分,只估计说话人空间,并从中提取出所包含的说话人因子,将说话人因子与支持向量机(SVM)结合起来构建一个基于因子分析-支持向量机(FA-SVM)的耳语说话人识别系统。本文在该识别系统的基础上增加了类内协方差规整(WCCN),线性判别分析(LDA)和冗余属性投影(NAP)三种信道补偿技术,并将经过信道补偿之后的说话人因子输入到支持向量机系统中进行识别。实验证明采用信道补偿之后的系统获得了比基线系统更好的识别结果。因为估计出的说话人因子仍然会包含信道信息的特点,本文对上述三种方法进行了相应的改进。针对类内协方差规整,本文采用平滑的类内规整矩阵取代原来的矩阵以改进识别效果。针对冗余属性投影,本文分析了冗余属性投影和基线系统之间的关联,提出了一种介于两者之问的差异补偿-冗余属性投影(VC-NAP)系统,该系统实现了一种可调的信道补偿,避免了因完全的NAP所带来的补偿误差,实验证明基于VC-NAP的系统比基于NAP的系统的识别效果要好。
其他文献
市值管理这一概念首次被提出是在股权分置改革之后,它不仅强调企业价值的最大化,还关注市场中企业价值的实现过程。文章以中交建和中国建筑两个上市公司为例,分别从内部和外
岗位管理就是在现代企业管理思想指导下有组织、有意识的岗位协调活动,是岗位设计、描述、评价、变更等活动的总称,是现代企业人事制度的组成部分,是国有企业管理创新的有效
《生物医学信息学导论》作为一门科技发展与科学精神类的公选课,旨在向全校各类专业的学生科普生物医学信息学领域的基础知识与前沿技术,具有涉猎知识范围广、内容跨度大、前
牙周病是口腔两大类疾病之一,是不分地域、民族和年龄,在世界范围内患病率较高的疾病~([1])。在我国,牙周病患病率居于龋病之上,且随年龄增加患病率升高。牙周炎主要表现为牙龈
山东作为文化资源大省,近些年来,文化产业有了快速发展,取得了一些成绩,但是与发达国家和国内一些省市相比,还有许多不足之处。论文提出转变观念,加快文化体制改革,整合文化
袋式脉冲除尘器作为重要的除尘设备之一,具有除尘效率高、清灰效果好、自动化强等优势,被广泛应用于冶金、电力、钢铁和化工等行业.针对国家环保部门对企业污染高排放要求,袋
随着我国网络使用者逐年增多,关于网络虚拟财产的侵权案件也屡见不鲜,通过对网络虚拟财产的清晰界定,从目前所存在的三个主流观点即知识产权性、债权性、物权性来认识虚拟财
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
在大学生中培育和践行社会主义核心价值观,是当前高校思想政治教育工作的主旋律、新方向。在大学生中积极培育和践行社会主义核心价值观是一个系统工程,不仅需要发挥课堂教学
新媒体的强势崛起,传统广播业正在承受着冲击。广播媒体应跟上时代步伐,以技术革新为手段,精准定位为依托,内容建设为根本,在媒体融合时代进发出新的生机。