语音分割相关论文
说话人的语音分割与聚类是研究把一段包含多人语音的音频切分,标出各语音段对应的说话人,以获知“何人在何时说话”的技术,是语音......
文语转换(TTS)是近年来语音处理领域内比较热门的研究对象,其功能是由计算机将文字文本转换成语音并输出。一个成功的文语转换系统......
本文研究语音保密通信技术,提出了利用同声源干扰的模拟语音保密通信方法。相比于加白噪声干扰的方法,该方法无法通过滤波等提高信......
当今的大词汇量的语音识别系统,在安静的实验室语音情况下已经获得了很高的识别率。但是,想要把语音识别推入到更加广阔的应用空间......
针对传统方法难以处理连音分割的问题,提出基于信息熵的粒子群优化分割方法.利用信息熵对语音进行粗分割,在长语音段计算时间序列复杂......
文中主要对王永忠等提出的灵活分割算法存在的问题做了相应的改进,并做了比较分析,然后将改进后的分割算法应用于语音信号的清-浊......
含噪语音信号的静音与语音分割,即端点检测问题是语音识别至关重要的一步.为了提高语音分割对环境的适应性,提出了一种利用小波变......
听觉场景分析(Auditory Scene Analysis,ASA)系统能将一个场景分解为与不同声源对应的语音流。分割是ASA的主要步骤,借助分割可将一......
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样......
在研究语音分形维数基础上,提出语音音素分割和模糊控制语音增强的新方法....
针对当前关键词识别少资源或零资源场景下的要求,提出一种基于音频自动分割技术和深度神经网络的关键词识别算法.首先采用一种基于......
针对说话人改变点检测问题,在MP3格式下用改进型B IC算法实现了多话者改变点的检测。根据非压缩域中MFCC的求取过程,提出了一种在......
为完成有声出版物中的语音自动分割,建立了一种时间阈值自适应加相似度判决的系统分割模型。时间阈值的确定是系统设计中的一个难......
为改进在真实对话中分割重叠语音的自然事件,训练一个深度卷积神经网络(DCNN),使用来自单声道音频的级别相对较低的对数标度梅尔频......
地空通信是地面管制单位与飞行员沟通的主要手段。随着空管自动化的发展,利用空管语音识别来提高空中交通的安全性、管制员的工作......
移动互联的快速发展带来最大的好处是信息交流的便捷,而随着信息交流的便捷产生了信息沟通方式的改变,信息交流从最初的文字图形等......
针对在噪声背景下连续语音信号的语音分割性能会明显下降的问题,提出了一种针对连续语音信号分割的新方法。该方法不再采用单一的......
首先分析了基于贝叶斯信息准则的语音分割原理和算法设计,接着研究了语音多点分割的原理和算法,最后分析了运用语音活性检测对于分......
随着网络技术和媒体应用的迅速发展,传统的文本检索已不能满足需要,视频检索由于数据量大而得不到应用,语音检索就显示出重要的研究价......
大词汇连续语音识别是当前语音识别研究的主流,探讨其中声调识别的特殊性是一项有意义的工作.本文从声调获取、语音分割、声调模式......
语音驱动口型动画是人脸表情动画中非常关键的部分。在研究语音与口型动画同步问题的基础上,提出一种真实、自然的语音口型动画实......
音素分割是语音研究的一个主要组成部分,在大词汇量连续语音识别及语音合成的过程中起着重要的作用。文章以贵州省中部苗语作为研......
为了对语音帧的清浊音属性进行判断,本文提出了一种基于快速样本熵的清浊音判决和语音分割方法。通过计算英语单音素发音的样本熵,......
随着网络技术和媒体应用的迅速发展,网络中的影音资源所占的比重越来越大。传统的文本检索已不能满足人们需要,视频检索由于数据量......
在连续语音的英语口语语料库中进行语义单元的识别发现是在其声学信号中发现重复的声学模式,然后将这些模式组合起来,定义具有明确......
为了解决含噪语句分割问题,也为了解决某些低信噪比环境下传统气导语句分割算法分割效果差、分割准确度低且算法自适应性弱等问题,......