语音和文本联合驱动卡通人脸动画的方法及其面向移动娱乐应用

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:zhaodehu10000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机网络技术、数字电视技术和通信技术日益成熟,极大地推动了多媒体产业的兴起,多媒体技术之间的信息融合越来越受到人们的重视,数字娱乐也逐渐体现了良好的发展前景。本文主要工作是针对卡通人脸动画的视觉语音相结合的研究,提出了一种综合语音和文本的驱动卡通人脸动画的多媒体技术,同时结合数字娱乐发展方向进行了实际应用的设计和探索。(1)提出了一种由语音和文本共同驱动的卡通人脸动画方法。首先建立卡通人脸音节-视位参数库,并对音节-视位参数进行非监督聚类分析,获得32种人脸视位基本类型,然后基于文本信息进行音节切分,获得准确的时长参数。结合视位的基本类型和语音时长参数,可以对输入的语音/文本进行连续动画拼接。本文提出的方法经过用100条从影视作品中收集的具有娱乐效果的语音/文本进行测试,结果表明可以克服单独的语音驱动或文本驱动的不足,取得更好的卡通人脸动画效果。(2)我们将这种语音和文本联合驱动方法应用于移动娱乐,设计了一套以用户娱乐、个性化需求为模式中心的多平台的用户个性化定制卡通动画合成及其点播系统。该系统具有C/S与B/S两种软件体系结构,分别实现了用户手机端和浏览器端上传配套的语音/文本、图片定制卡通动画以及点播功能。
其他文献
随着数字图像处理技术的快速发展和Internet的普及,数字图像的应用愈加广泛,对图像进行有效管理和查询的需求也越来越迫切。基于内容的图像检索(content-based image retriev
探究式学习是一种强调学生自主积极投身其中的学习方式,主要有自主探究、合作探究和启发探究等模式。国际上对探究式学习对人才的成长和发展所产生的重要影响已经产生了共识,我
CISC结构的微处理器指令功能复杂,指令长度、格式不定。设计高效合理的译码器是加快指令译码速度,提高指令流水效率,进而有效提高处理器性能的重要保证。 本论文来源于西北工
支持向量机作为一种基于统计学习理论的新型学习算法,能很好的解决有限样本情况下的学习问题。这种方法从理论上控制了机器学习的复杂性,同时具有良好的收敛速度和推广能力。它
在企业的信息化建设过程中,企业组织中的各个部门或者地区分公司根据自身情况,构建了不同的信息系统来维护与自己工作相关的数据,这样企业的整个信息资产就被分裂成通常所说
随着互联网技术的发展,人们获取新闻的方式也在发生显著地变化,从传统的报纸、杂志向新闻聚合网站发展,如国内的网易新闻、新浪新闻,国外的谷歌新闻、雅虎新闻等。人们从信息
近年来,作为数据库领域和信息检索领域的前沿课题之一,对Top-N查询的研究得到了蓬勃发展,研究重点主要是查询处理策略和排序函数。以关系数据库为基础的Top-N查询能够检索出与关
近几年来,对于QOS-aware的应用程序的需求越来越多,尤其是在SOC(Service Oriented Computing)环境下。这些应用程序由一些QoS-aware的组件动态组合而成,这些组件常常会注册它们
VPN(Virtual Private Network,虚拟专用网)能够让企业为移动用户、分支机构以及合作伙伴提供安全方便访问企业内部资源。现在市场上主要有两种形式的VPN系统:IPSec VPN和SSL VP
P2P技术和搜索引擎相关技术是当前科研院所、公司争相研究的热点。P2P的分布式网络结构具有可扩展性、健壮性、负载均衡等特点,与传统的分布式系统相比,P2P技术具有无可比拟的