搜索与 Hichem Sahli 相关的论文

基于谐波的乐纹提取和音乐检索

[期刊论文] 作者：周虹辰,蒋冬梅,Hichem Sahli,Werner Ve, 来源：计算机工程与应用年份：2012

提出了一种基于节拍内音乐谐波特性的乐纹特征提取方法,首先求得每帧音乐的谐波信息,再利用跟踪得到的节拍,计算节拍内所有帧的谐波信息的均值,构成此节拍的乐纹特征矩阵。为...

下载此文

基于基频特征的情感语音识别研究

[期刊论文] 作者：郭鹏娟,蒋冬梅,Hichem Sahli,Werner Verhelst,, 来源：计算机应用研究年份：2007

探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析,总结了情感语音基频的变化规律,确定了用于情感识别的12维的基频的基本特征以及扩展特征,运用混合高斯模型进行情感识别,并作了识别实验,获得了较好的结果。......

下载此文

基于基频特征的情感语音识别研究

[期刊论文] 作者：郭鹏娟,蒋冬梅,Hichem Sahli,Werner Ve, 来源：计算机应用研究年份：2007

探索在不同的情感状态下的基音特征变化规律。通过对含有生气、高兴、悲伤情感语音信号进行分析，总结了情感语音基频的变化规律，确定了用于情感识别的12维的基频的基本特征以及......

下载此文

基于动态贝叶斯网络的听视觉融合情感识别

[期刊论文] 作者：陈丹淇,蒋冬梅,Ilse Ravyse,Hichem Sahli,, 来源：计算机仿真年份：2011

在多媒体领域的研究中,对听视觉情感识别,如何融合听视觉情感信息是关键问题。传统的融合方法采用状态同步多流隐马尔可夫模型(Syn_AVHMM),但忽略了音视频情感信息之间的异步关系,从而影响识别结果。为了对听视觉情感信息之间的关联和异步关系进行更准确的描述,......

下载此文

基于谐波的乐纹提取和音乐检索

[期刊论文] 作者：周虹辰,蒋冬梅,Hichem Sahli,Werner Verhelst,, 来源：计算机工程与应用年份：2012

提出了一种基于节拍内音乐谐波特性的乐纹特征提取方法,首先求得每帧音乐的谐波信息,再利用跟踪得到的节拍,计算节拍内所有帧的谐波信息的均值,构成此节拍的乐纹特征矩阵.为...

下载此文

基于发音特征的音视频融合语音识别模型

[期刊论文] 作者：吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner, 来源：计算机工程年份：2011

构建一种基于发音特征的音视频双流动态贝叶斯网络（DBN）语音识别模型（AF_AV_DBN）,定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实验表......

下载此文

基于三流DBN模型的听视觉情感识别

[期刊论文] 作者：吕兰兰,蒋冬梅,王风娜,Hichem Sahli,Werne, 来源：计算机工程年份：2012

为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型（T_AsyDBN）。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入流,...

下载此文

基于发音特征的音视频融合语音识别模型

[期刊论文] 作者：吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner, 来源：计算机工程年份：2004

构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AFAV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步.在音视频语音数据库上的语音识别实验...

下载此文

基于动态贝叶斯网络的语音识别及音素切分研究

[期刊论文] 作者：孙阿利,蒋冬梅,吕国云,Hichem Sahli,Wemer, 来源：计算机应用研究年份：2007

研究了一种基于动态贝叶斯网络（dynamic bayesian networks，DBN）的语音识别建模方法，利用GMTK（graphical model tool kits）工具构建音素级音频流DBN语音训练和识别模型，同时与传统的...

下载此文

基于三流DBN模型的听视觉情感识别

[期刊论文] 作者：吕兰兰,蒋冬梅,王风娜,Hichem Sahli,Werner Verhelst,, 来源：计算机工程年份：2012

为更好地对听视觉情感信息之间的关联关系进行建模,提出一种三流混合动态贝叶斯网络情感识别模型(T_AsyDBN)。采用MFCC特征及基于基频和短时能量的局域韵律特征作为听觉输入...

下载此文

基于发音特征的音视频融合语音识别模型

[期刊论文] 作者：吴鹏,蒋冬梅,王风娜,Hichem SAHLI,Werner VERHELST,, 来源：计算机工程年份：2011

构建一种基于发音特征的音视频双流动态贝叶斯网络(DBN)语音识别模型(AF_AV_DBN),定义节点的条件概率关系,使发音特征状态的变化可以异步。在音视频语音数据库上的语音识别实...

下载此文

基于动态贝叶斯网络的语音识别及音素切分研究

[期刊论文] 作者：孙阿利,蒋冬梅,吕国云,Hichem Sahli,Werner Verhelst,, 来源：计算机应用研究年份：2007

研究了一种基于动态贝叶斯网络(dynamic bayesian networks,DBN)的语音识别建模方法,利用GMTK(graphical model tool kits)工具构建音素级音频流DBN语音训练和识别模型,同时与传统的基于隐马尔可夫的语音识别结果进行比较,并给出词与音素的切分结果。实验表明,......

下载此文

基于AAM和异步发音特征DBN 模型的逼真可视语音合成

[会议论文] 作者：张贺,蒋冬梅,吴鹏,谢磊,付中华,Hichem Sahli, 来源：第十一届全国人机语音通讯学术会议年份：2011

本文提出了一种基于主动外观模型(AAM)特征和异步发音特征DBN模型(AF_AVDBN)的逼真可视语音合成方法。在 AF_AVDBN模型中，发音特征（如嘴唇、舌体和声门/软腭的状态）之间允许在一定约束范围内异步，以更好地模拟协同发音现象，为人类真实发音过程建模。在模型训练中，以42......

下载此文

基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究

[期刊论文] 作者：吕国云,蒋冬梅,张艳宁,赵荣椿,Hichem Sahli,, 来源：西北工业大学学报年份：2008

提出一个新颖的单流多状态动态贝叶斯网络（Single stream Multi-states DynamicBayesian Network,SM-DBN）模型,以实现大词汇量连续语音识别和音素切分。该模型在Bilmes等人提出...

下载此文

基于Viseme的连续语音识别系统及Talking Head

[期刊论文] 作者：蒋冬梅,谢磊,Ilse Ravyse,赵荣椿,Hichem Sahli,Jan Cornelis, 来源：电子与信息学报年份：2004

为实现听觉/视觉驱动的说话人头部动画,该文给出了一个基于viseme(说话时的基本嘴形单位)的连续语音识别系统。它训练viseme隐马尔可夫模型(HMM),识别语音为viseme图像序列。建模采用triseme的概念来考虑viseme的上下文相关性,但它需要超大量的训练数据。该文根......

下载此文

语音驱动说话人头部中的基于决策树的Triseme建模方法

[会议论文] 作者：谢磊,蒋冬梅,赵荣椿,Ilse Cravyse,Hichem Sahli,Jan Conlenis, 来源：中国航空学会信号与信息处理专业第六届学术会议年份：2002

Viseme是在语音驱动说话人头部动画模型中常用的一种音频-视频模型.为了得到更精确的模型就要考虑驱动语音的上下文信息,因此引入了Triseme模型.但是引入Triseme模型后,随着...

下载此文

一种稳健的基于Visemic LDA的口形动态特征及听视觉语音识别

[期刊论文] 作者：谢磊,付中华,蒋冬梅,赵荣椿,Wernet Verhelst,Hichem Sahli,Jan Conlenis,, 来源：电子与信息学报年份：2005

视觉特征提取是听视觉语音识别研究的热点问题.文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分.文章同时提出...

下载此文

一种稳健的基于VisemicLDA的口形动态特征及听视觉语音识别

[期刊论文] 作者：谢磊,付中华,蒋冬梅,赵荣椿,Werner Verhelst,Hichem Sahli,Jan Conlenis, 来源：电子与信息学报年份：2005

视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提...

下载此文

基于三特征流DBN 模型的听视觉情感识别

[会议论文] 作者：崔玉路,蒋冬梅,张晓静,谢磊,付中华,Ping Fan,Hichem Sahli, 来源：第十一届全国人机语音通讯学术会议年份：2011

本文构建了一种三特征流混合动态贝叶斯网络（T_AsyDBN）听视觉情感识别模型，听觉流采用MFCC特征和经过PCA降维的局部韵律特征，视觉流定义了二维面部几何特征和三维面部动作参数特征，并经过PCA降维，形成19维视觉特征。两个听觉特征流在状态层同步，而它们与视觉特征流可以......

下载此文

一种用于说话人头部动画的Viseme语音识别系统

[期刊论文] 作者：谢磊,赵荣椿,蒋冬梅,Ilse Cravyse,Hichem Sahli,Werner Verhelst,Jan Corlenis,Ignace Lemahieu, 来源：计算机应用与软件年份：2004

Viseme是在语音驱动说话人头部动画中一种常用的为口形建立的音频 -视频模型。本文尝试建立viseme隐马尔可夫模型(HMM) ,用于驱动说话人头部的语音识别系统 ,称为前映射系统。为了得到更精确的模型以提高识别率 ,引入考虑发音口形上下文的Triseme模型。但是引入......

下载此文

看过本文同时还关注