语音驱动说话人头部中的基于决策树的Triseme建模方法

来源 :中国航空学会信号与信息处理专业第六届学术会议 | 被引量 : 0次 | 上传用户:lx84015092
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Viseme是在语音驱动说话人头部动画模型中常用的一种音频-视频模型.为了得到更精确的模型就要考虑驱动语音的上下文信息,因此引入了Triseme模型.但是引入Triseme模型后,随着模型数量的急剧增加将导致训练数据的严重不足.模型状态捆绑可以缓解这一问题.本文将决策树方法引入triseme状态捆绑中,实现对"不可见"模型的建模,同时也讨论了决策树视频问题集合的设计.
其他文献
OFDM-CDMA作为一种新的通信技术具有抗多径衰落的优良特点,因此目前得到了广泛的关注.但是这种技术有一个主要弱点,多载波的频域信号叠加会引起时域信号的峰值功率和均值功率
本文主要是对燃料混合云雾产生爆轰起爆装置进行探讨,文章着眼于实现云雾起爆装置的可控抛射轨迹,对影响云雾起爆装置抛射轨迹的因素,进行了较为详细的分析.并结合实际研究过
本文主要从集散型控制系统也就是DCS型控制系统的控制原理出发,着重介绍了DCS系统的总体结构及其功能、详细说明了其系统具体的计算机现场总线、操作站、工程师站组成与系统
本文主要介绍基于GPRS的车辆监控与指挥调度系统的系统原理及移动通信链路实现过程中的若干关键技术问题.
本文提出在外弹道测量的测速信道中采用微波测速变换的方法,减小了测速变换所引入的测速信道误差及测速变换器的研制难度,该方法在我国北方高精度测量带中获得成功应用.
直接数字频率合成技术(Direct Digital Synthesis,简称DDS)是近年来发展起来的一种新型信号合成技术.由于采用了全数字结构,它具有合成信号相对频带宽、频率转换时间短、频率
蚁群算法是近年来新出现的随机搜索寻优算法,在TSP等问题中得到富有成效的应用之后,已引起越来越多的关注.对于该算法在图像压缩领域中的应用,目前尚无这方面的研究发表,所以
显示和海量存储模块是为了方便调试工作而单独增加的一个模块,作战时并不包括在信号处理机中.本模块的功能包括直接提供一维高分辨像的模拟输出,便于示波器观察;实验过程中,
近年来,GIS领域出现了向三维发展的趋势,另外,VR技术的应用也不断推广,计算机图形技术、高级人机接口技术、科学计算可视化技术的发展为GIS与VR的结合提供了可能.本文介绍了V
时间管理服务作为HLA的核心内容,本文首先简要介绍了时间管理的一些基本概念,然后以仿真应用为基础,介绍了联邦成员开发过程中,时间推进策略选择的依据和步骤.最后着重论述了