倒谱系数相关论文
语音信号的短时能量和过零点是语音端点检测中应用最多的语音特征。而准确的语音端点检测是提高识别系统精度的重要保证。为此,本......
近几年,基于确认模式下的说话人识别被广泛应用在金融安全、门禁系统等领域中。本文对GMM的说话人识别算法进行了研究,并将其改造......
近年来,随着智能家居和语音助手等产品的大量涌现,真正实现了智能语音识别从科研机构到市场应用的转型。智能语音交互正改变着人们的......
咳嗽的自动分类在临床上具有重要的辅助诊断作用。传统的Mel频率倒谱系数(MFCC)采用Mel均匀滤波器组,高频段的滤波器分布较稀疏,未......
鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非......
【摘要】普通话水平测试是践行“推广普通话”这一基本国策的重要手段。随着技术革新,传统的“人工测试”转变到由计算机进行辅助测......
人耳具有良好的抗噪识别能力,.因此在语音识别中更多的研究者致力于研究人耳听觉特性,建立更符合人耳听觉特性的语音特征参数模型......
语种识别就是用计算机来自动识别一段发音所属语种的一项技术,它是在语音识别基础上发展起来的。随着语音识别技术的不断发展,语种......
语音端点检测的目的是从包含语音的一段信号中确定出语音的起点和终点,是语音信号处理的前端操作,在语音增强、语音编码、语音识别......
直升机辐射的声信号在空气中衰减速度慢、传播距离远,是直升机目标识别的主要依据.受人类听觉系统优异的声音信号识别能力的启发,......
期刊
腭裂患者存在不同程度语音障碍,可致语音理解度降低,影响与人交流的能力。腭裂语音理解度评估是腭裂语音治疗的重要步骤。除主观评......
为了能实时监测听众的情绪状态变化并据此调整音乐播放列表,本文中,我们基于便携式干电极脑电数据提出了一种脑电驱动的个性化情绪......
针对非限定文本的自动讲话人辨认问题,对提取有效的识别特征进行了理论和实验分析,使用语音信号LPC倒谱的瞬时谱和过渡谱的特征参量作为......
在本文中,我们提出一种噪声环境下具有鲁棒性的语音特征提取的新方法。首先介绍了在高噪声环境下语音识别所遇到的特殊问题,随后对现......
本文就Kohonen自组织特征映射神经网络模型采用其基本学习算法直接用于孤立字非特定人的语音识别时所存在的不足进行了改进。大量......
在面向特定任务的语声对话系统中,关键词识别是一种具有高鲁棒(ROBUST)性能的语音输入技术.本文探讨一种用于自动语声对话系统的关......
研制的计算机软件,以普通的声霸卡为使用背景,实现了用隐马尔可夫模型对孤立短语信号的自动建模过程。讨论了该软件的实现方法和需要......
1.引言语音信号在进入语音识别系统之前,通常受到一些诸如语音产生过程、记录过程以及传输过程中产生的通道畸变的影响。例如:麦......
本文提出一种采用数字信号处理方法中的线性预测技术及基音与共振峰提取技术,分离话者个人身份特征的新方法,由此建立与本文有关的话......
本文提出了一种由连续隐马尔可夫模型(CDHMM)与多层感知器(MLP)构成的混合模型,并将该模型应用于语音孤立词识别。这种混合模型首先用CD......
本文在定量分析了声道长度与共振峰位置的关系之后,结合听觉系统中语音频谱的编码方式,提出了元音识别的模板假设,为解决非特定人......
提出一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法.它是在对语音通信中主、客观音质评价的研......
对高噪声背景下的语音特点进行了分析,提出了适应于高噪声背景下孤立词语音识别的全套方法,进行了系统实现。对本方法和系统进行了详......
最小错识率(MCE)HMM训练方法是最直接的判决训练方法之一,原理上比最大似然接方法优越得多。但是,充分发挥MCE的性能的困难在于如何将......
本文提出了在特征提取阶段利用帧间相关性的一种方法。对每一帧考虑其前后各n帧,加上自身帧共2n+1帧的特征矢量串起来组合成一个大......
说话人自适应是提高非特定人语音识别性能的有效方法之一。本文将MAP算法应用于汉语数码语音识别中,并讨论了几种加快自适应速度的......
在汉语数码语音识别( M D S R)中,“2”和“8”是最易混淆的一对语音。文章分析了“2”和“8”混淆的原因,发现可用于分辨“2”和“8”的区别特征......
语音识别算法中,动态时间规整(DTW)和隐马尔可夫模型(HMM)是最有效的识别算法,并且两者之间有着本质的联系和内在的统一[1],据此前期工作中,已经建立......
利用曲线拟合与主分量分析神经网络相结合的方法,提出了一种既反映声道变化规律又符合人耳听觉特点的语音识别新特征. 与其他神经......
在语音压缩编码中,矢量量化占有很大比重和计算量.码本的好坏与方法的选择有很大的关系.笔者介绍了一种方法,将神经网络和隐含马尔可夫......
让人与计算机自由地交谈,机器能听懂人讲话,是汉语语音识别技术最终将实现的目标。进入九十年代,语音识别方面的研究进一步升温。......
提出了一种在汉语连续语音识别中基于 3维空间 Viterbi算法的音素模型和声调模型识别概率的统合方法。该方法采用60个音素单位的HMM和8个声调单位......
语音关键词识别和确认方法在语音对话系统中得到了广泛的应用 .评价此类系统性能的一个重要指标就是处理非关键词 (垃圾 )的能力 .......
文中介绍了一种基于 IP网的顽健语音识别技术 ,首先分析了影响 IP网语音识别技术的两大因素。接着简要介绍了 ITU- T语音编码标准 ......
音频的自动分类,尤其是语音和音乐的分类,是提取音频结构和内容语义的重要手段之一,它在基于内容的音频检索、视频的检索和摘要以......
研究韵律特征在说话人确认中的应用。将整个韵律轨迹以固定段长和段移进行片段划分,并对其进行勒让德多项式拟合从而获取连续性的......
用于音乐和语音的识别方法不适用于非结构化环境声音事件的识别。提出一种基于隐马尔可夫模型(HMM)和支持向量机(SVM)的二层分类策......
本文主要阐述了语音信号声源模型的结构,其中主要包括代表一激励参数的脉冲及噪声激励源,以及代表声道特性的线性时变系统。指出声......
本文研究自动发音人识别中测试文本的选择.提出并证实了结合汉语特点的测试文本选择的重要性和应用潜力,并总结了几条简单规则;应......
提出了一种既符合人耳听觉特性又具有良好抗噪性的语音特征分析方法。首先将单边自相关函数序列进行时间方向的平滑处理,提高单边......
本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处......