【摘 要】
:
说话人识别属于生物特征识别的一种,也称为声纹识别。说话人识别在人的身份识别领域具有广泛的研究价值和应用前景。说话人识别中反映人的个性的特征参数的提取是影响识别结
论文部分内容阅读
说话人识别属于生物特征识别的一种,也称为声纹识别。说话人识别在人的身份识别领域具有广泛的研究价值和应用前景。说话人识别中反映人的个性的特征参数的提取是影响识别结果的一个关键问题。本文主要研究各种语音特征参数以及其改进的参数应用于说话人识别。文中对于说话人识别中的三种基本特征参数,MFCC、LPCC和PLPCC分别研究了其提取过程,将这三种参数分别应用于已经搭建好的说话人识别平台。本文说话人识别模型用的是在与文本无关的语音识别中常用的GMM模型。文中完成了三种参数分别用于说话人识别的实验,分析了其实验结果。并且将基音周期这种反映说话人声带的固有特征的参数分别与三种参数组合,完成实验结果的分析。针对以上实验结果中噪声情况下,特别低信噪比下识别率明显下降,如Odb高斯白噪声下都低于10%。文中提出了两种改进的参数提取方法:基于基音同步预处理的参数提取与基于浊音谱重建的参数提取。基音同步主要是根据基音周期的长度实现对语音信号的可变窗长的加窗,可以补偿浊音在非周期长度被截断导致的频谱泄露,提取的参数会使高频段的参数更加的具有鲁棒性。浊音谱重建根据浊音谱的短时谱具有明显的谐波特性,且在噪声环境下谐波特性不会发生明显的改变,基于此可以对含噪浊音谱进行重建,使重建后的频谱接近真实的纯净语音谱,再将经过谱重建后提取的参数应用于说话人识别。实验结果都表明以上两种改进可以明显提高说话人识别系统的识别率,尤特别是在低信噪比环境下的识别率会有明显的提高,如Odb的高斯白噪声下识别率提高都在15%到20%左右。
其他文献
双频激光器在卫星激光测距、全息干涉测量、气象参数确定和非线性光学频率转换等方面的潜在应用而受到极大的关注。掺钕材料的激光增益介质,由于较大的发射截面和宽带泵浦光
东汉建立伊始,匈奴、羌、鲜卑、乌桓、蛮(夷)等少数族就对政权构成了严重的威胁与破坏.光武帝在"柔道"思想的指导下,针对不同的少数族,因时因地制宜,施行了一系列政治、军事
结合格式塔心理学理论与数字图像处理技术,分析了格式塔视觉心理的相关结论在图像处理方面的一些应用,提出了基于格式塔视觉心理的图像分割和图像重建方法,力求达到图像客观
简要回顾 2 0世纪世界社会主义运动的进程 ,对 2 0世纪社会主义运动出现的两次低潮进行了比较分析 ,指出两次低潮的具体过程虽然不同 ,但存在许多共同的特点 ,通过分析可以对
对青少年加强爱国主义教育,是建设社会主义精神文明的一项重要任务,也是学校德育的一项基本内容。因此,在生物教学中,教师也要结合教学特点,渗透爱国主义教育。
为了提高管道内检测数据的利用率,充分挖掘内检测数据的价值,结合国内外长输管道内检测数据比对方法,分析了在关键点对齐过程中可能出现的问题并提出了解决方法,同时总结了关
指出了层叠式蛋鸡笼养模式的优点,介绍了层叠式蛋鸡笼养的设备构成、适用范围及性能特点,阐述了维护保养方法以及常见故障的排除。
目的:观察分析持续封闭负压引流技术(VSD)在深度烧伤创面修复中的应用疗效。方法:选取2017年5月至2018年5月福建医科大学附属协和医院收治的深度烧伤创面修复患者64例为研究
全无机CsPbX3(X=Cl,Br,I)量子点具有立方钙钛矿结构,通过改变卤族元素含量可以调节量子点带隙宽度,使量子点发光峰位可调覆盖可见光范围。并且钙钛矿材料发光效率高,半峰宽窄,
伴随着国民经济的快速发展,人们的消费层次和生活水平也在不断的提高,居民用户对电力部门在供电质量、供电可靠性和故障定位、隔离、抢修等方面提出了更严格的要求,而线路故