基于矢量量化(VQ)和混合高斯模型(GMM)的说话人识别的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:huangsheng200888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别始于20世纪30年代,从20世纪60年代开始日益成为当今的一个研究热点。说话人识别具有广泛的应用前景,如保安、公安司法、军事、财经和信息服务等领域。正因为说话人识别具有如此广阔的应用前景,国内外许许多多的工作者投身于这一领域的研究中,使得说话人识别方面出现巨大发展。但它还远远没有成熟。本课题以语音信号的LPC倒谱系数、基音周期和维格纳-威利谱的混合特征参数作为识别的特征矢量集。运用矢量量化(VQ)和高斯混合模型(GMM)技术实现与文本有关及无关的说话人识别。在一个10人,2400个的语音库上进行了系统的识别实验。本论文的主要工作有:1、在说话人识别系统的语音特征参数提取部分,详细阐述了声道模型、线性预测编码(LPC)分析、LPC倒谱系数、MEL倒谱系数的求解;2、介绍了说话人识别的不同方法,主要介绍了矢量量化技术及其在说话人识别中的应用,其本质是在一个解空间中用少数的几个特殊的点来代表空间中全部的有效点,以达到编码、压缩的目的。同时,还介绍了高斯混合模型(GMM)的理论和实现,包括该模型的训练和识别;3、阐述了遗传算法的基本思想和处理方法。将遗传算法的全局优化与VQ技术、GMM技术结合起来,采用科学的编码方案,动态的定标技术,高效的交叉策略,得到了模型的优化作用,提高了说话人识别率。本篇论文从以上三方面讨论了说话人识别的理论,最后介绍了系统的实现与实验结果,并对实验结果进行了讨论、比较。
其他文献
频谱检测是认知无线电网络的重要环节,协同频谱检测可以克服阴影效应、多径衰落和隐藏终端等各种不确定因素的影响,根据不同的频谱检测技术可以采用不同的协同方式。本文主要针
茶碱为甲基黄嘌呤衍生物,具有增强心脏收缩、改善心脏血流动力学及利尿作用,在过去的几十年里,茶碱类药物已广泛应用于哮喘、慢性阻塞性肺部疾病( COPD)、支气管炎等疾病. 过
20世纪90年代以来,移动通信网和Internet是信息领域中发展最快的两个网络,大大地改变了人类的生活方式。目前,人们已不仅仅满足能够得到移动语音服务,还希望通过移动网络使用数据
ST2与IL-33结合能够减少心肌纤维化,抑制心肌肥大,减少心肌凋亡及改善心脏功能.sST2可以欺骗性地与IL-33结合抑制心肌保护作用. 截止目前,发现ST2在社区人群中的参考值范围与
目的 探讨入院时心力衰竭对感染性休克患者预后的影响. 方法 采取前瞻性研究方法选取EICU和ICU收治的既往有器质性心脏病,且入院时合并心力衰竭的感染性休克患者24例为研究组
目前,第三代移动通信系统(3G)逐步走向商用化,下一代移动通信系统正成为研究的热点,其目标就是实现无所不在的、高质量的、高速率的移动多媒体传输。而移动通信频谱资源的有限性
目的 探讨半乳凝集素-3(Galectin-3,Ga-3)对心力衰竭(心衰)患者的诊断及评估作用. 方法 选取40例心力衰竭患者,测定治疗前后Ga-3?脑钠肽(BNP),行Ga-3与BNP的相关性分析,行Ga-
本文研究基于星上CDMA-CWTDM(码分多址-连续波时分复用)转换的卫星通信新体制。与基于地面中心站CDMA-TDM转换的卫星通信体制相比,这种新体制不要昂贵笨重的大型中心站,却同
目的 探讨影响重症监护病房(ICU)脓毒症患者预后的相关因素,指导临床医师采取有效控制措施. 方法 回顾性分析2006-01~2016-12期间入住北京老年医院ICU 759例脓毒症患者的临床