论文部分内容阅读
随着计算机多媒体和网络技术的迅速发展,人们对各种人机交互界面的人性化程度要求越来越高。人脸动画作为人机交互中的重要技术之一,在三十多年来一直是计算机图形学领域的研究热点,可以广泛应用于电影制作、游戏娱乐、医疗研究、远程会议,代理和化身等领域。图象变形技术是人脸动画中的关键技术之一。利用高效的图象变形算法,可以产生具有真实感的人脸动画。本文对人脸动画中的图象变形算法进行了研究,实现了一个语音驱动的人脸动画系统。主要研究内容及成果如下:
1)总结了现有的图象变形算法,并详细阐述了基于三角剖分的算法、基于特征线的算法以及基于径向基函数的算法的原理及实现,分析了这些算法的优缺点。
2)对传统的Mesh Warping图象变形算法进行了改进。将原算法中的一维插值技术从样条插值简化为分段线性插值,提高了变形的实时性,并将图象变形完全独立到X和Y两个方向进行,降低了样条构造以及变形的难度。最后,利用该算法进行图象变形,产生了说话者各种口型以及表情。
3)提出了一种基于Biharmonic样条插值的图象变形算法。利用该算法实现了图象渐变,并针对变形图象真实感、变形图象边界稳定性、变形实时性以及操作灵活性等方面,与Mesh Warping算法进行了比较,实验结果表明,该算法产生的变形图象更真实,操作更灵活。
4)基于MPEG-4的人脸动画参数定义,利用SAPI5.0语音识别引擎提取语音中的可视音素及时间信息,利用改进的Mesh Warping算法产生说话者各种口型以及丰富的表情,从而实现了一个语音驱动的人脸动画系统。