基于机器学习的情感视位合成

来源 :第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议(第一届全国和谐人机环境联合学术大会) | 被引量 : 0次 | 上传用户:xiaotaowang33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在可视语音合成技术当中,对于表情的处理是非常关键的技术.然而,传统的可视语音合成技术由于受到算法本身以及样本数量的限制,往往忽略了在合成语音视频中对表情因素的处理,这直接导致了合成结果缺乏真实感和感染力.为了解决这一问题,本文在传统的数据驱动的可视语音合成技术上,融合了我们的参数化表情合成技术,创造性地提出了一种情感视位合成技术.从实验结果上看,本文提出的算法,有效地解决了传统可视语音合成中缺乏情感表现力的难题.
其他文献
影响低渗透油气藏产能的因素众多,确定不同地质特征、不同开发阶段各个因素对产能影响的重要程度,可为低渗油气藏生产预测和开发调整提供决策依据.根据灰色理论中的关联分析
会议
多视点视频是近几年视频处理领域研究的热点,它的提出体现了下一代多媒体应用网络化、交互性和真实感的方向发展.本文介绍了交互式多视点视频点播系统的结构框架和其支持的交
会议
基于多树的应用级组播中,核心的思想是切分组播内容并且沿着多棵独立的组播树组播切分后的子流.但目前的分流方案(MDC)消耗较大的带宽且实现复杂.在这篇文章中,我们基于目前
利用安全组播机制,可以高效、安全地实现多媒体数据的网络传输.本文总结了多媒体安全组播密钥管理机制的特性需求,并针对集中式、分散式、分布式三类安全组播密钥管理方案进
会议
本文针对互联网拥塞控制,提出了一种新的基于模糊理论的拥塞控制算法(FLCCA).依据队列的缓冲区占用率,以及满队列时间作为语言变量输入,建立拥塞控制模型,通过模糊推理计算数
会议
MANET的链路容量随干扰、节点移动等因素的变化而变化.本文从链路容量角度出发研究MANET中流媒体传输机制.提出一种简单的基于接收方无线链路容量测试方法RWLCM的无线ad-hoc
根据高光谱图像强烈的谱间相关性,本文提出一种基于分类预测的高光谱图像无损压缩算法.首先根据谱间相关性的大小,将若干个相邻的波段分为一组.由于高光谱图像每个波段都具有
本文提出一种基于小波域隐马尔可夫模型的图像超分辨率重建算法.首先介绍图像信号的小波域隐马尔可夫模型;然后将其作为先验知识给出了超分辨率重建算法;详细推导了对数似然
视频转码技术能动态地将MPEG-2码流转换成为AVS码流,有效解决目前AVS节目源不足及大量MPEG-2设备利用问题.本文分析了MPEG-2和AVS编码算法差异,回顾视频转码技术,根据应用需
人工神经网络是特征识别的有力工具.在研究对驻极体麦克图像识别方法的基础上,本文提出了一种用改进的BP神经网络进行图像特征的识别和学习算法,并给出了动量系数和学习率的