基于VQ与GMM的说话人识别

来源 :东南大学 | 被引量 : 0次 | 上传用户:pxp99
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文分析了说话人识别中的主要技术,从特征参数的获取到各种识别方法的应用,重点介绍了矢量量化(VQ)和高斯混合模型(GMM)两种基于模板的识别方法。并实现了一个主要基于VQ的说话人识别系统,在闭集测试中取得了较好的效果。 在VQ方法的训练中,提出了一种基于逐点搜索的改进的LBG算法,较好地解决了传统LBG算法在迭代过程中会产生空胞腔、无法适用于多种距离测度等问题。并设计了一种对VQ量化误差进行规格化处理的方法,使规格化后的量化误差更加适合对说话人进行判决。 对GMM方法的框架进行了初步的研究,并对EM算法中迭代初值的选定、方差的限定及模型混合数对识别结果的影响进行了一定程度的讨论。 在预处理方面,提出了一种基于基音轮廓抖动的去除语音中噪音段和静音段的方法,取得了很好的实际效果。 最终的识别系统针对8KHz的单声道语音,采用了10阶的线性预测系数、10阶的线性预测倒谱系数以及基音参数构建了一个主要采用VQ方法的说话人识别系统,在11个说话人的闭集测试中取得了接近100%。这个系统被进一步扩展到在多人对话场景下的自动分段说话人识别,也取得了一定的识别效果。
其他文献
学生管理是学校管理的重要组成部分,本文对警校学生管理工作的相关内容进行了细致探讨.
随着通信事业的迅猛发展,接入网技术已经获得了广泛的应用。接入网是最复杂的网络系统之一,因而也是最难管理的网络之一。在接入网网管系统的建设中,除了要面对网管系统建设中的
全国各高校经过十余年的双语教学探索与改革实践,在完善双语教学师资队伍、建设双语教材、改进双语教学模式等方面取得了一定成绩与经验,但在整体管理和建设方面还存在明显不
焦化废水中污染物组成复杂,含有挥发酚、多环芳烃和氧硫氮等杂环化合物,属较难生化降解的高浓度有机工业废水.目前,焦化废水在经过预处理、生化处理后还要经过深度处理才能达
随着移动通信的发展,移动通信用户数和Internet用户数急剧增加,人们期望新一代移动通信系统不仅具有更大的容量,还要支持移动多媒体业务。具体应包括话音业务,以及低高速数据和图
尽管写实油画面临重重压力,但写实油画也有其明显的特殊性。比如形象表述的直接和视觉上的真实性,这对于将近百年历史的中国油画而言,更有利于在世界绘画平台上建树形象,一张
由于名著导读是全面培养学生语文阅读理解能力的有效途径之一,所以在初中语文课堂教学中,引起了广大教师的高度重视,但在课堂教学所取得的实际效果上,往往广大教师并不满意,
期刊
在移动通信系统中,MIMO技术是指利用多发射天线和多接收天线进行无线传输的技术。目前,无线MIMO技术已经被认为是实现高数据速率,高传输质量和高系统容量的未来高速宽带无线Inte
目的 了解北京市疱疹性咽峡炎的流行情况及病原体构成,为该病的预防与控制提供参考。方法 收集2016年北京市15个区监测医院中首次就诊的10岁以下疱疹性咽峡炎和手足口病病例基本信息及临床表现,并采集咽拭子进行病原体检测。结果 本研究共纳入符合条件的疱疹性咽峡炎病例744例,其中5岁及以下病例占86.83%,性别比(男:女)为1.23: 1;手足口病病例1 935例,5岁及以下病例占88.94%,性别
我国证券投资基金运作的实践表明,基金违规操作大量存在,基金黑幕频发,严重损害了持有人的利益,挫伤了其投资的信心,不利于我国证券投资基金市场的健康发展。因此,加强持有人