话者识别相关论文
长期以来面向实用化的话者识别系统的研究在国际及国内都受到了极大的关注和重视.该文以实用为目标,从系统结构简单、用户注册和使......
多模态信息可以提高人机交互与对话的自然性和高效性,使机器人更好地服务用户。本文针对部分交互形式进行了探索与研究:(1)机器人......
在汉语普通话中,边音是仅有的四个浊辅音之一,它的发音方法常因后接元音的不同而产生许多变体.在与不同元音组合时,共振峰的频率分......
本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行......
目前应用最广泛的模糊聚类算法是基于目标函数的模糊k-均值算法,针对该算法存在的缺点,本文提出一种改进的聚类算法,利用遗传算法......
为了提高话者识别系统的噪声鲁棒性,本文对CHMM进行了改进,将每帧特征参数之间的差分参数来对应状态之间的转移,从而使帧间信息在......
文章主要研究了标准普通话中9个元音发音的声学特征,特别是共振峰模式、特点及共振峰频率的目标值,进而分析了不同发音人之间的共......
传统的基于最大似然估计高斯混合模型参数的方法是一种无导师的学习方法.该方法的主要缺点是学习算法在估计一类模式模型中的参数时......
通常我们用K -平均法和K -邻近法估计椭圆基函数 (EBF)中心位置与函数宽度等参数。但上述的方法在输入矢量包含相关元素时存在性能......
传统的乐器识别方法采用的是树型分类方法,这种方法分类过程比较繁琐,而且精度不高。该文把话者识别的方法应用到乐器识别之中,采......
研究了一种基于RASTA-PLP特征分析的与文本无关的话者识别方法话者模型训练采用的是基于矢量量化的方法,实验验证了该方法的有效性......
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能减化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤......
介绍了隐马尔可夫模型的有关理论、算法及其在说话人识别中的应用,并以线性预测倒谱LPCC及其差分形式作为特征参量,采用自左向右HMM......
为提高井下矿工的安全系数,加强矿井计算机系统的保密防范,便于及时获取井下矿工和计算机系统使用者的身份,用顽健话者识别设计一个易......
说话人识别是指通过说话人的语音来自动识别说话人的身份,它在许多领域内有良好的应用前景。本文重点研究在噪声环境下,话者识别中语......
讨论了以二次等式约束条件为基础的一种改进的向量机即最小二乘向量机(LSSVM)算法,用其对话者进行识别,并与传统的支持向量机(SVM)进行了......
提出了一种使用图像信息进行话者识别的方案,建立了一个共计916个样本、每个样本包含连续20帧图片的实验数据集。将基于图像信息的......
话者识别中目标模型的最大期望算法存在着出现奇异阵的重大缺陷,而最大似然估计虽然不会出现奇异阵,但识别率比较低。提出了一种循环......
文中研究表明,反映说话人特征信息的特征参数矢量的各个分量通常具有不同的分布,对正确识别说话人身份的有效性是有差别的。文中将这......
重点研究在噪声环境下,话者识别中语音信号的特征提取。将能简化信号,消除较小分量而保留信号的基本特征的数学形态滤波器良好的滤波......
基于文本无关的话者识别系统应用前景广阔,单一特征参数法往往难以完全反映说话人的个人语音特征,因此目前研究的重点在于多种特征......
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的Mel倒谱系数(MFCC)应用于耳语音中就存在......
针对话者识别系统中特征向量不定长和交叉信道干扰等问题,提出一种基于超向量的扰动属性投影(NAP)核函数。该函数是一种新型的序列......
目的探究语音情感分析系统(Layered Voice Analysis,LVA)在不同情况下的表现,并通过分析数据找出影响系统识别率的因素。方法设置......
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量。本文对MFCC的高、低阶系数在与文本有关的话者识别......
为确定声纹鉴定中咳嗽音声纹特征的应用价值,录制30名条件相近、身体健康发音人的咳嗽声各3组样本。将样本输入OTExpert法庭语音分......
长时平均FFT(fast fourier transform)功率谱是利用快速傅立叶变换FFT方法算出的每帧的短时频谱的长时平均。FFT功率谱中可以直观......
首先,采用传统的DTW(Dynamic Time Warping,动态时间弯折)算法,计算积累距离矩阵,求得最佳匹配路径所对应的匹配距离;然后,将最后......
利用话者识别原理和语音数字信号处理技术对人声建模方法进行研究,建立了基于GMM模型的VDR环境下的人声识别基准系统;从分析影响人......
语音、指纹、虹膜等生物特征由于其不可复制性与长期稳定性,已经成为身份识别的主要手段。而语音与其他特征相比,具有易于获取、传......
本文介绍了一个实时、有效的话者自动验证系统,重点对话者验证的机理进行了分析,并对与验证系统有关的几个主要问题作了简要的说明......
随着信息和计算机技术的发展,人们对信息处理方法的要求越来越高。很多实际应用中通过传感器获得的是一些有用信号的混叠信号或带......
本文对18对双胞胎正常朗读语音2000Hz以下这一特窄频率范围的共振峰频率特性进行了定量测量、比较、分析,统计得出了该频率范围内利......
尽管我国从事司法话者识别等相关技术的研究、应用已有近30余年的历史,但该项技术仍然处在发展阶段。为进一步促进该项技术的发展,......
目的研究在话者识别领域,不同频率共振峰特征价值的大小。方法对10对女性与8对男性双胞胎正常朗读语音的共振峰频率特性进行定量测......