论文部分内容阅读
法庭说话人识别主要研究说话人识别技术在司法领域中的应用,它最主要的功能就是鉴别罪犯语音样本与嫌疑人的语音样本是否由相同的说话人产生的。近年来,法庭说话人识别已成为说话人识别技术的研究热点之一,但是,在法庭证据评估体系的统一、法庭证据的解释理论、短语音样本和非匹配信道语音处理等方面仍有待完善。本文以基于贝叶斯统计的似然比法庭证据评估方法和说话人识别为背景,对其理论模型、系统设计和应用等方面进行了系统研究,主要研究成果和创新之处概括如下: (1)针对传统法庭说话人识别中存在大量主观判断并且无法量化证据强度的弊端,引入了基于贝叶斯理论的似然比证据评估体系。在似然比体系下,设计了多个半自动和自动的法庭说话人识别系统,对普通话数据库进行了系统的评测。 (2)提出了元音倒谱特征的概念,实现了语音自动特征(倒谱系数)在相同的语音单元上进行比较,消除了不同语音内容的影响,也消除了在提取语音非自动特征中人为因素的影响,同时提高了工作效率。 (3)完善了声学-语音学说话人识别方法与似然比证据评估体系的融合,测试了声学-语音学参数的识别性能,总结出声学-语音学参数的适用条件;拓展了高斯混合模型在文本相关说话人识别中的应用,并对使用不同语音特征的多识别系统进行了融合。 (4)提出了基于高斯混合模型-参考背景模型的法庭自动说话人识别方法,降低了识别系统对罪犯和嫌疑人语音样本时长、背景人群数量的要求,以满足实际的法庭案件条件。在此基础上,提出了融合嫌疑人自身变化性信息的自适应同源方差控制算法,增强了识别系统的鲁棒性。 (5)提出了结合说话人模型补偿和Logistic回归的法庭自动说话人识别方法,降低了法庭语音案件中常见的信道不匹配问题的影响,提高了系统可靠性。 本文的研究进一步完善了法庭说话人识别的理论计算和系统设计,对于法庭证据评估制度的变革和法庭语音证据的科学评估具有重要的指导意义。