一种海马-内嗅皮质系统启发的视觉概念表征理解模型

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lxting86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉概念是视觉认知的基本单位。从哲学及认知心理学的角度出发,视觉概念可以被定义为一组视觉属性的抽象。洞悉大脑如何学习、组织、表达和理解视觉概念对构建人工视觉认知系统至关重要。近年来,以深度学习为代表的视觉计算模型在物体分类,物体检测,语义分割以及图像描述等领域取得了许多令人瞩目的成就。尽管取得了巨大的进步,这些模型并不关心大脑是如何表征和理解视觉概念的。传统的视觉计算模型更倾向于学习语言符号和视觉表征之间的映射,视觉概念在这类模型当中通常没有明确的组织和表达方式。此外,在传统的模型当中,关于视觉概念理解也没有明确的定义。为解决上述问题,受人及哺乳动物大脑的海马-内嗅皮质系统的一般化信息处理机制启发,本文提出一种视觉概念空间模型——VCSM(Visual Concept Space Model)来组织表达视觉概念。特别的,在视觉概念空间模型中,视觉概念被定义为一组视觉属性上的抽象。本文模拟内嗅皮质的网格细胞来构建视觉概念空间,并用所提出的模拟海马位置细胞的“概念细胞”在视觉空间中表征视觉概念。人类对某一概念的理解包含两个方面:首先,人类能凭借经验对遇到的新概念进行识别和推理;其次,人类能根据他人对某一概念的描述想象出相应的实例。受此启发,本文将视觉概念理解定义为概念推断(即推断输入图像潜在的视觉概念)和图像重构(即根据给出的概念“想象”对应的图像)。综合视觉概念的表征和理解,本文的研究内容如下:首先,本文深入研究了基于变分自编码器的表征解耦学习。表征解耦学习的目的是获取输入图像非耦合的表征,即用图像编码后得到的隐变量的不同信息维度表示不同的生成因子,其中生成因子指定了图像的各种属性。其次,基于图像的非耦合表征,本文提出一种属性函数方法来表示图像中物体的各种视觉属性。属性函数使用了模糊信息处理机制,将视觉属性的符号含义直接建立在视觉表征之上。再次,基于非耦合表征,本文借鉴内嗅皮质网格细胞的信息处理机制构建了视觉概念空间。在视觉概念空间中,视觉概念通过概念细胞来组织和表达。概念细胞由属性函数构成,它们模拟了海马位置细胞的信息处理机制。最后,本文研究了模型的视觉概念理解能力。为了像人一样理解视觉概念概念,模型需要能够推断输入图像隐含的视觉概念,还要能够根据给出的概念生成符合属性描述的图像,即具备双向生成能力。文章将视觉概念空间模型应用到3D Chairs和Extended Yale Face Database B数据集以对其表现进行验证。实验结果表明视觉概念空间模型能够准确地理解视觉概念且能生成丰富多样的图像。
其他文献
那不定矿床属南冈底斯火山岩浆弧,北部紧邻沙莫勒-麦拉-洛巴堆-米拉山断裂带与冈底斯弧背断隆带,复杂的地质构造环境和优越的成矿地质条件使得那不定矿床成为冈底斯成矿带上具有一定成矿潜力的矽卡岩型铅锌矿床,但其成矿地质背景认识及成矿模式均未开展研究。因而,从区域成矿地质背景的角度出发,以西藏那不定铅锌矿为研究对象,开展综合野外地质调查、岩相学、主微量元素、硫化物S-Pb同位素、石英O-H同位素、锆石U-
为了进一步实现利用机载SAR(Synthetic Aperture Radar,合成孔径雷达)图像对沙漠、海面或者境外等难以设立地面控制点的区域内目标位置的获取,机载SAR图像定位系统应当具备在
随着社会经济的快速发展,消费升级、个性化需求、移动互联网技术等因素促使传统零售模式迫切需要进行变革。新零售模式的出现彻底改变了传统消费观念,推动了线上线下深度融合,从2016年新零售概念的提出至今,无论是企业还是资本都不断在这一领域进行着布局,对新零售主导权的争夺变得异常激烈。在竞争异常激烈的新零售市场上,FYKJ想要杀出一条血路,就必须清晰的明确自身的优势和劣势,同时科学规划发展战略,根据目前的
中小企业作为我国国民经济的重要组成部分,对社会经济的发展具有较高贡献性,这与银行等传统金融机构对中小企业的低扶持性形成了鲜明的对比,融资难、融资贵、融资慢等问题长期阻碍了中小企业的可持续发展。大数据、区块链、云计算和人工智能等高新技术的金融科技的崛起,为中小企业提供了新的技术支持,也为其开拓了新的融资渠道和融资形式。党的十九大报告明确指出:深化金融改革,服务实体经济。这一论述为我国金融科技纾解中小
本文基于线阵激光雷达的测距原理,设计了一种多通道精确延时的距离像模拟器,用于产生线阵激光雷达在现实场景下的多路回波信号。便于科研人员在室内对线阵激光雷达进行性能测
随着现代烟草农业的深入推进,国家烟草专卖局(以下简称国家局)对烟叶工作提出“守住一条红线、提高三个水平、夯实两个基础”的工作目标,为全面落实国家局工作要求,有效的考核体系是基础保障。然而,当前永州市烟草公司烟叶线考核体系存在诸多弊端,需要进一步改进完善,以促进各项工作落到实处,全面提升烟叶生产水平和生产效率。本文以永州市烟草公司烟叶线考核体系为研究对象,以激发烟叶线员工工作积极性、提升工作效率为目
当前,中国正处于转型升级的关键时期,市场环境错综复杂,为破解社会发展难题,政府高瞻远瞩,将实施大众创业为解决问题的着眼点。实施积极的创业政策有利于社会创新活力的迸发,
作为一种先进分离技术,纳滤(Nanoflitration,简称NF)广泛用于水和废水的处理。纳滤水处理过程中,为防止膜结垢需要向进水中添加阻垢剂;纳滤处理循环冷却水的排污水时,水中也是含阻垢剂的。然而,阻垢剂对纳滤工艺性能的影响尚缺乏深入研究。本文选择典型阻垢剂氨基三亚甲基磷酸(Aminotris(methylenephosphonic acid),简称ATMP),通过纳滤膜的透过实验及扫描电子显
近年来,随着社交媒体的兴起,谣言所带来的问题比以往任何时候都更加严重。由于谣言涉及经济、健康、政治等公共话题,其真实性、正确性无法被及时验证或永远都没有办法被验证。这些谣言带有未经证实甚至是虚假的信息,可能会引起公众恐慌,进而造成严重的经济损失,对社会产生不良影响。面对社交媒体上的海量信息,专业人士鉴别谣言所需的时间和精力是巨大的,且存在识别滞后,覆盖不全面等问题。因此研究和设计兼具准确率,覆盖率
边坡可靠度分析在岩土工程中得到了越来越多的应用,传统的概率可靠度分析已经发展的较完善。然而,实际岩土工程中,数据信息少,难以获取各参数的精确分布,使传统的概率可靠度分析方法的应用受到限制。因此,非常有必要引入非概率可靠度分析方法来分析边坡稳定性。一般来说,非概率可靠度分析模型只需随机变量的变化范围即可,突破了传统概率求解可靠度的局限性。本文以椭球模型为研究对象,将其应用于无限长边坡、二维边坡的可靠