基于互信息理论的说话人识别研究

被引量 : 0次 | 上传用户:lleii
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于生物特征的身份识别技术是当前国际上的重点研究内容,自动说话人识别通过语音识别说话人的身份,在系统安全认证、司法鉴定、金融服务以及电子侦听等领域有着广泛的应用价值。本文在对现有说话人识别技术分析的基础上,运用互信息理论进行说话人识别的研究,提出了可实际应用的语音信号互信息计算方法,并针对基于文本和文本无关的说话人识别分别提出了相应的说话人语音模型和互信息匹配算法,实验证明了本文提出的语音信号互信息计算方法的有效性。 本文的主要研究内容如下: 一、对自动说话人识别原理以及相关的语音产生机理和语音信号处理方法作了全面的描述与分析。特别在特征参数选择与提取、说话人语音模型建立、模式匹配以及语音的声学特性方面进行了详细的分析。 二、从信息量的角度考察分析语音信号之间的特征相关性,提出随机干扰信号的概念来解释和描述语音信号之间的失真,并从随机信号的特征以及随机信号分析理论推导出这一信号的统计分布特性,最终,语音信号之间互信息的计算归结到随机干扰信号的熵并得到解决。 三、研究了语音信号互信息计算的具体算法,提出了基于模式的线性映射匹配算法LPM和非线性搜索匹配算法NLM。 四、对互信息测度的聚类特性进行分析,通过类内凝聚度、类间耦合度和类间重叠三大指标对互信息测度的分类特性进行了详细分析,并与其它常用测度Euclidean、Itakura-Saito和Mahalanobis进行比较,结果显示出互信息测度的模式分类有效性和优越性。 五、针对不同识别要求研究适合互信息测度应用的说话人模型,提出应用于基于文本的说活人识别的多模板模型MTM和应用于文本无关说话人识别的全特征矢量集模型CFC,实验证明这些模型能够充分表达说话人的语音特征。 六、对于文本无关的说话人识别,综合考虑距离空间和信息空间的特性,提出多级最小最大
其他文献
云南省是一个以山地高原地形为主的省份,由于特殊的地理位置和多样化的地形地貌,云南是中国地质灾害最为频发的地区之一。随着山区建设加快,近年来崩塌、滑坡、泥石流、地面
我国已进入全面建设小康社会的发展阶段,在这一重要历史阶段,统筹城乡发展,构建社会和谐已成了社会发展重大战略目标。社会保障制度的建立和完善是社会发展的重大战略目标之
目的介绍介入性超声在妇产科的应用.方法应用介入性超声对87例患者进行妇产科的治疗和诊断操作.结果87例患者的治疗和诊断操作的成功率达98.9%.结论介入性超声是在超声显像基
目前,我国社会经济已步入新常态,城镇化发展也进入了新阶段,在城镇化进程中,传统依靠廉价生产要素驱动产业发展的模式面临着严峻挑战,必须依靠"创新驱动"才能实现产业的可持
<正>瓷器是我国古代的伟大发明之一,作为最具中国特色的一种商品,自唐代开始就大量销往海外。清初,由于沿海抗清势力的存在,清政府采取了严厉的海禁政策——"片板不许下水,粒
<正> 一、前言矿床模拟法是根据已知矿床的各种地质特征、成矿条件及成因特征,建立矿床模型,使某种类型的矿床模式化、典型化,然后分析研究评价区的地质特征与模型的相似程度
疾病史属于国际学术前沿领域。目前,国内研究刚刚起步,研究成果集中在几个有限的领域中。近代上海不仅是经济文化中心,令人瞩目,它同样也是各种传染病的汇集地。传染病在上海
综观现今研究大理白族饮食文化的书籍和文章,发现以下几个主要问题:其一,对当代大理白族饮食文化现况的研究很多,但都只限于表面论述,并未从历史渊源、文化底蕴等更深层次来
新的《音乐课程标准》提出音乐课程的性质与价值主要体现在:审美体验价值、创造性发展价值、社会交往价值、文化传承价值,体现了以音乐审美体验为核心,使学习内容生动有趣、
在过去几年里我国大学英语教学存在着投入大收获小的现象,作者从福州两所高校所进行的抽样调查的结果显示多数学生将大学英语教学的效率低的现象归咎于测试的手段。而新制定