基于多维语义模型的中国手语视频合成方法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：chenming88623

【摘要】

：

手语是聋哑人群体进行交流的语言，它运用手部、面部、头部以及身体的空间运动来表达语义，是一种视觉空间语言。将其应用于计算机等交互界面中，可为听障人群提供更为形象生动的视

【作者】

：

王茹

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2012年期

【关键词】

：

多维语义模型手语视频合成方法数据库构建相似度评估过渡路径

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

手语是聋哑人群体进行交流的语言，它运用手部、面部、头部以及身体的空间运动来表达语义，是一种视觉空间语言。将其应用于计算机等交互界面中，可为听障人群提供更为形象生动的视觉语言表达界面，满足其同健听人一样享受现代文明的权利，改善其生活质量，具有广泛的社会意义。目前基于三维模型的手语合成方法及相关理论已经取得了较大的进展，但是在合成过程中由于数据采集与重定向过程中的误差，三维虚拟模型的手语动作的表达和聋人实际生活中的手语表达并不完全吻合，另外三维虚拟模型的真实感也影响了对手语的理解。而基于真人视频拼接的手语合成则完全反应了真人打手语的真实过程，相对三维模型来说提高了手语表达的真实感和准确度。　　本文以提高真实感为目标研究基于多维语义模型的手语视频合成方法。提出面向中国手语视频的多维语义描述方法，建立包括手语词基元和过渡基元的多粒度数据库，研究基于视频多维语义信息的手语词基元选取、过渡路径生成、多部件合成和拼接视频平滑处理的问题，从而合成与文本一致的自然过渡的手语视频，最后综合手语视频的视觉特征和运动语义特征构建中国手语视频相似度评估模型，基于该模型对合成效果进行视觉和运动特征上的评估，以验证本文合成方法的有效性。　　本文的研究有广泛的应用前景。所用到的动作建模，视频分析和理解等技术涉及计算机图形学、图像处理、计算机视觉等多学科，其成果可扩展到动作视频的分析、合成研究领域，丰富人机交互领域的理论成果。　　本文针对二维手语视频合成进行研究，并取得了以下研究成果：　　1.面向中国手语视频的多维语义描述方法。面向中国手语视频合成，提出了手语视频信息描述方法，建立了中国手语视频多维语义模型，为手语基元检索、过渡路径生成及过渡帧合成提供一致的语义描述。　　2.基于语义的过渡路径生成方法。基于中国手语多维语义模型中量化的手语语义信息，优化拼接点估计与过渡路径计算，有效地增强了合成手语视频的真实感。　　3.基于多部件图像的过渡帧合成。针对手语合成过程中，手语词组合数量巨大，导致难以获取完备的过渡序列集合这一问题，将手语视频按人体结构划分为多个部件，对手和胳膊进行完备形态库的建模，融合各个部件合成过渡视频帧，降低中国手语合成对采集数据量的需求。　　4.面向中国手语视频的相似度评估模型。基于视觉特征和运动语义特征，提出并构建了中国手语视频相似度评估模型，该模型融合了视觉特征、形态及运动轨迹变化等运动特征。基于本文提出的模型对手语视频评价结果与主观评价一致，该模型可应用于相似手语视频的检索、手语视频语义的理解等领域。

其他文献

手机3D动画自动生成系统中色彩和光照规划的设计和实现

全过程计算机辅助动画自动生成技术(简称动画自动生成技术)是一种新的基于人工智能的动画生成技术。手机3D动画自动生成系统将动画自动生成技术应用于手机短信领域，依据短信内

学位

手机短信动画自动生成系统色彩规划光照计算配色方案灯光布局

基于国产操作系统的漏洞扫描与验证系统的研究

随着信息网络技术的发展，网络信息安全已成为维护国家安全和社会稳定的重要因素。使用国外软件由于可能存在后门问题，给我国的信息安全带来了巨大的隐患，因此我国大力发展国产基

学位

网络信息安全国产软件漏洞扫描验证系统插件技术

水产品安全管理与追溯体系的研究与建立

中国的水产品总产量位居世界第一，水产品在人们的生活中作为极为重要的食物来源，扮演着重要的角色。目前水产品消费市场上的产品质量参差不齐，且缺乏有效的信息管理技术，一旦出现

学位

水产品行业管理追溯体系产品质量食品安全

基于同步密钥与EUKey的认证系统的研究与实现

随着互联网技术的发展，互联网已经成为人们生活的一部分，电子商务也成为了人们的主要消费方式之一。但是在互联网这样一个开放的网络环境中，对于电子商务等对信息安全特别敏感的

学位

网络安全身份认证嵌入式系统同步密钥EUKey技术

科技文献知识挖掘关键技术研究

随着我国综合国力的增强以及对科技发展的日益重视，我国的科学技术研究事业进入了高速发展阶段。作为科技研究成果的重要载体和参考指标，科技文献的产生数量和质量也在急剧上升

学位

科技文献文本挖掘术语识别功能性分类形式化主题文本分类信息抽取

基于光线追踪器的波动光学效果绘制技术研究

作为波动光学领域的经典现象，衍射和干涉是光的波动性的主要标志之一，并广泛存在于彩色光盘、彩虹状的肥皂泡和光彩熠熠的蝴蝶等自然场景中。在计算机渲染的图像中加入这些效果

学位

动画制作光线追踪器波动光学彩色效果

基于实物的儿童编程系统的研究与实现

随着科技的发展以及人们生活水平的提高，计算机在人们生活和工作中越来越普及，并且扮演着非常重要的角色。对儿童进行计算机科学的教育也越来越受到国内外研究人员的关注。计算

学位

实物编程系统软件设计用户评估儿童

基于遗传算法MC/DC覆盖的测试用例自动生成

测试用例生成是软件测试的重要内容，随着现代软件系统日益复杂庞大，传统的搜索技术难以有效地应用于测试用例生成领域。遗传算法在解决大空间、非线性等高复杂度问题时，显示了独

学位

测试用例生成遗传算法修正条件判定覆盖搜索导向性

社交网络隐私保护技术研究

伴随着人们个性化自我展示需求的日益增长，越来越多的用户加入到社交网络中，社交网络的用户数和数据规模呈爆炸式增长。社交网络数据中蕴含着丰富的用户偏好信息、行为模式以及

学位

社交网络隐私保护数据发布用户重识别敏感位置数据库

矢量地图的多重水印算法研究

随着计算机网络的普及应用，基于网络的空间信息资源正日益丰富，其应用领域也在快速发展，以满足社会对空间信息的需求。矢量地图由于其放大不失真、精度高等特点，在地图查询、工程

学位

矢量地图数字水印版权保护零比特动态扩展可逆算法

基于多维语义模型的中国手语视频合成方法研究

与本文相关的学术论文