基于深度学习机制的人与物体交互活动识别技术

被引量 : 5次 | 上传用户：wgy_2003_9

【摘要】

：

人与物体交互活动识别研究是图像理解研究的核心研究内容之一,它对提高图像理解的智能水平具有重要的理论意义。同时,它在信息检索、图像自动收集、人机交互、以及安保自动化

【作者】

：

白琳

【发表日期】

：

2015年01期

【关键词】

：

人与物体交互活动深度学习机制大脑皮层深度层次结构图像视觉结构人与物体3D空间分布

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人与物体交互活动识别研究是图像理解研究的核心研究内容之一,它对提高图像理解的智能水平具有重要的理论意义。同时,它在信息检索、图像自动收集、人机交互、以及安保自动化等诸多研究领域具有广泛的应用价值。本文通过分析大脑皮层的深度层次结构以及其中蕴含的深度学习机制,归纳总结出了大脑皮层理解人与物体交互活动的基本流程和关键处理阶段,并以此作为研究指导理念,研究了基于静态图像的人与物体交互活动识别技术。本文的主要研究内容和创新成果包括:(1)本文以大脑皮层的深度层次结构和深度学习机制为依据,设计了一种新的人与物体交互活动识别框架。框架通过模拟大脑皮层逐层、逐区域地识别人与物体交互活动的过程,针对其中的四个关键子任务,设计了四个核心模型,即:图像物体3D空间分布重塑、图像视觉结构探测、人与物体交互活动识别、和图像主题内容描述模型,共同完成人与物体交互活动识别任务。(2)分析3D空间信息在二维平面上的成像规律,提出了一种针对单目单图物体3D空间分布重塑的模型。模型使用离散抽象分析方法,重构图像中深度变化连续、变化率一致的区域的深度信息,进而重塑图像物体的3D空间分布信息。该模型提高了物体绝对深度、相对深度、以及物体真实尺寸预测的准确率。(3)在分析图像中人与物体的3D空间相对位置关系的基础上,提出了一种图像视觉结构探测模型。模型通过估计人与物体联合出现的概率强度,预测图像所蕴含的视觉结构。本文的模型在视觉结构所蕴含的人与物体空间相对位置关系统计分析,以及视觉结构探测准确率方面均优于目前具有代表性的Visual Phrase模型、Mutual Model模型和Group of Objects模型。(4)以大脑皮层PC区识别人与物体交互活动的方式和过程为参照,提出了一种人与物体交互活动识别模型。模型以大脑皮层的深度层次结构为基础,设计了一种基于Factors的条件融合知识推理机,将人与物体的3D空间相对位置作为先验条件,辅助模型提取交互活动的高级不变性特征;并采用深度学习机制,逐层高效地训练模型的参数,最终实现人与物体交互活动识别。本文的模型提高了人与物体交互活动识别的准确率。(5)本文提出了一种图像主题自动生成模型。模型包含两个子模型:图像主要语义关系预测和图像主题描述语句自动生成。图像主要语义关系预测模型以分析交互活动与场景物体之间的空间联合发生概率为基础,预测与交互活动最匹配的场景物体之间的语义关系。图像主题描述语句自动生成模型以交互活动与场景物体之间的语义关系为核心,设计了一种基于Lexicalization PCFG的图像主题生成算法,自动生成符合英语语法和语义规范的图像主题描述语句。本文的模型不仅能正确描述图像中人与物体的交互活动,而且生成的语句表现出了较好的语法规范性和认知合理性。

其他文献

谈陶行知教育思想指导下高专幼儿戏剧教学中的创新意识

陶行知先生认为师范教育要创新,有新思想新理念的教师才能教出与时俱进的新知识,培养出优秀的新人才。笔者在陶先生教育思想的指导下,在高专学前教育专业必修课幼儿戏剧教学

期刊

生活教育灵活创编精心创设大胆创新

城市低碳交通发展指数研究

基于现有研究文献和低碳交通实践,对城市低碳交通发展进行了理论阐释。依据城市低碳交通概念、福利经济学、系统论和可持续发展理论,构建了城市低碳交通发展指数指标体系,并

期刊

城市交通低碳交通

新生儿阵发性室上性心动过速12例临床观察

目的:探讨新生儿阵发性室上性心动过速的临床特点及预后。方法:新生儿阵发性室上性心动过速12例,经心电监护,心电图等检查确诊,分别给予三磷酸腺苷、西地兰、维生素C、1、6二

期刊

阵发性室上性心动过速新生儿射频消融术普罗帕酮

戴高乐与公民投票

<正> 夏尔·戴高乐是法国当代最著名的政治家之一。自1958年6月重返政坛到1969年4月宣布下野的10年间,他先后举行过五次公民投票。第一次公民投票是关于新宪法的,时间是1958

期刊

公民投票波拿巴戴高乐阿尔及利亚

南通市崇川区2007～2009年预防接种副反应监测分析

目的:评价南通市崇川区自2007年以来开展预防接种副反应(AEFI)监测系统的运转情况。方法:对预防接种的副反应监测资料,运用描述流行病学方法分析其流行特征。结果:全区收集AE

期刊

预防接种副反应DTP无细胞疫苗DTP全细胞疫苗JEV灭活疫苗监测

民营科技企业“国际化”问题的思考

一、民营科技企业在“国际化”进程中存在的主要问题目前民营科技企业的“国际化”模式主要有四种：即在海外办厂的模式、通过资本运作的模式、靠低成本和低利润将产品卖到海外

期刊

民营科技企业国际化战略对外投资问题的思考

永川区——五措联动努力打造美丽乡村

<正>永川区按照重庆市的总体部署,把"美丽乡村"建设作为统筹城乡发展的重要载体,围绕美丽乡村建设的总体要求,统筹谋划,科学编制美丽乡村建设规划;健全机制,强化美丽乡村建设

期刊

永川区美丽乡村建设总体部署多措并举

针刺“落枕穴”治疗落枕50例

<正> 近年来,我们参考《针灸临床取穴图解》针刺“落枕穴”。治疗50例落枕患者,疗效满意。 [方法]取颈项患侧手背面的“落枕穴”,又叫外劳宫,项强穴。手背向上,第二、第三掌

期刊

经外奇穴经络系统手阳明大肠经

毛泽东论中医——中国对世界有三大贡献,第一是中医

毛泽东的哲学素养是大家公认的,即使抛开他的领导身份,在谈论医学时也有他自己独特点见解——"治好病"的结果导向评价体系和中西医合作思想我刊特别看中的是,他对医学和医术

期刊

毛泽东刘惠民

H地产集团商业地产竞争战略研究

H地产集团长期以来都是传统住宅开发企业,但是行业环境发生了很大变化,住宅开发的黄金时代逐渐远去,H地产集团的住宅地产开发业务也逐渐遭遇瓶颈,而商业地产开发时代已经到来

学位

商业地产竞争战略竞争优势

基于深度学习机制的人与物体交互活动识别技术

与本文相关的学术论文