搜索筛选:
搜索耗时0.1004秒,为你在为你在102,285,761篇论文里面共找到 21 篇相符的论文内容
类      型:
[期刊论文] 作者:周虹辰,蒋冬梅,Hichem Sahli,Werner Ve, 来源:计算机工程与应用 年份:2012
提出了一种基于节拍内音乐谐波特性的乐纹特征提取方法,首先求得每帧音乐的谐波信息,再利用跟踪得到的节拍,计算节拍内所有帧的谐波信息的均值,构成此节拍的乐纹特征矩阵。为...
[期刊论文] 作者:郭鹏娟,蒋冬梅,Hichem Sahli,Werner Verhelst,, 来源:计算机应用研究 年份:2007
探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,获得了较好的结果。......
[期刊论文] 作者:郭鹏娟,蒋冬梅,Hichem Sahli,Werner Ve, 来源:计算机应用研究 年份:2007
探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及......
[期刊论文] 作者:陈丹淇,蒋冬梅,Ilse Ravyse,Hichem Sahli,, 来源:计算机仿真 年份:2011
在多媒体领域的研究中,对听视觉情感识别,如何融合听视觉情感信息是关键问题。传统的融合方法采用状态同步多流隐马尔可夫模型(Syn_AVHMM),但忽略了音视频情感信息之间的异步关系,从而影响识别结果。为了对听视觉情感信息之间的关联和异步关系进行更准确的描述,......
[期刊论文] 作者:周虹辰,蒋冬梅,Hichem Sahli,Werner Verhelst,, 来源:计算机工程与应用 年份:2012
提出了一种基于节拍内音乐谐波特性的乐纹特征提取方法,首先求得每帧音乐的谐波信息,再利用跟踪得到的节拍,计算节拍内所有帧的谐波信息的均值,构成此节拍的乐纹特征矩阵.为...
[期刊论文] 作者:吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner, 来源:计算机工程 年份:2011
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表......
[期刊论文] 作者:吕兰兰,蒋冬梅,王风娜,Hichem Sahli,Werne, 来源:计算机工程 年份:2012
为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,...
[期刊论文] 作者:吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner, 来源:计算机工程 年份:2004
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验...
[期刊论文] 作者:孙阿利,蒋冬梅,吕国云,Hichem Sahli,Wemer, 来源:计算机应用研究 年份:2007
研究了一种基于动态贝叶斯网络(dynamic bayesian networks,DBN)的语音识别建模方法,利用GMTK(graphical model tool kits)工具构建音素级音频流DBN语音训练和识别模型,同时与传统的...
[期刊论文] 作者:吕兰兰,蒋冬梅,王风娜,Hichem Sahli,Werner Verhelst,, 来源:计算机工程 年份:2012
为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入...
[期刊论文] 作者:吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner VERHELST,, 来源:计算机工程 年份:2011
构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实...
[期刊论文] 作者:孙阿利,蒋冬梅,吕国云,Hichem Sahli,Werner Verhelst,, 来源:计算机应用研究 年份:2007
研究了一种基于动态贝叶斯网络(dynamic bayesian networks,DBN)的语音识别建模方法,利用GMTK(graphical model tool kits)工具构建音素级音频流DBN语音训练和识别模型,同时与传统的基于隐马尔可夫的语音识别结果进行比较,并给出词与音素的切分结果。实验表明,......
[会议论文] 作者:张贺,蒋冬梅,吴鹏,谢磊,付中华,Hichem Sahli, 来源:第十一届全国人机语音通讯学术会议 年份:2011
本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中,发音特征(如嘴唇、舌体和声门/软腭的状态)之间允许在一定约束范围内异步,以更好地模拟协同发音现象,为人类真实发音过程建模。在模型训练中,以42......
[期刊论文] 作者:吕国云,蒋冬梅,张艳宁,赵荣椿,Hichem Sahli,, 来源:西北工业大学学报 年份:2008
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states DynamicBayesian Network,SM-DBN)模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出...
[期刊论文] 作者:蒋冬梅,谢磊,Ilse Ravyse,赵荣椿,Hichem Sahli,Jan Cornelis, 来源:电子与信息学报 年份:2004
为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统。它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列。建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据。该文根......
[会议论文] 作者:谢磊,蒋冬梅,赵荣椿,Ilse Cravyse,Hichem Sahli,Jan Conlenis, 来源:中国航空学会信号与信息处理专业第六届学术会议 年份:2002
Viseme是在语音驱动说话人头部动画模型中常用的一种音频-视频模型.为了得到更精确的模型就要考虑驱动语音的上下文信息,因此引入了Triseme模型.但是引入Triseme模型后,随着...
[期刊论文] 作者:谢磊,付中华,蒋冬梅,赵荣椿,Wernet Verhelst,Hichem Sahli,Jan Conlenis,, 来源:电子与信息学报 年份:2005
视觉特征提取是听视觉语音识别研究的热点问题.文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分.文章同时提出...
[期刊论文] 作者:谢磊,付中华,蒋冬梅,赵荣椿,Werner Verhelst,Hichem Sahli,Jan Conlenis, 来源:电子与信息学报 年份:2005
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提...
[会议论文] 作者:崔玉路,蒋冬梅,张晓静,谢磊,付中华,Ping Fan,Hichem Sahli, 来源:第十一届全国人机语音通讯学术会议 年份:2011
本文构建了一种三特征流混合动态贝叶斯网络(T_AsyDBN)听视觉情感识别模型,听觉流采用MFCC特征和经过PCA降维的局部韵律特征,视觉流定义了二维面部几何特征和三维面部动作参数特征,并经过PCA降维,形成19维视觉特征。两个听觉特征流在状态层同步,而它们与视觉特征流可以......
[期刊论文] 作者:谢磊,赵荣椿,蒋冬梅,Ilse Cravyse,Hichem Sahli,Werner Verhelst,Jan Corlenis,Ignace Lemahieu, 来源:计算机应用与软件 年份:2004
Viseme是在语音驱动说话人头部动画中一种常用的为口形建立的音频 -视频模型。本文尝试建立viseme隐马尔可夫模型(HMM) ,用于驱动说话人头部的语音识别系统 ,称为前映射系统。为了得到更精确的模型以提高识别率 ,引入考虑发音口形上下文的Triseme模型。但是引入......
相关搜索: