受神经科学启发的计算机识别和注意模型

来源 :清华大学 | 被引量 : 0次 | 上传用户:hz_gyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经科学对计算机视觉有很强的借鉴意义。人的视觉神经系统具有出色的视觉感知能力,可以快速地对海量视觉输入进行压缩和选择,通过层级通路对信息进行高效表示,利用各种复杂的神经机制去适应环境。在几十年的发展历程中,计算机视觉从神经科学中获得了不少灵感和启发,一些计算模型和视觉系统的研究有密切联系,比如手工设计的视觉特征与神经元的感受野、卷积神经网络与初级视皮层和层级通路、显著性模型与视觉搜索实验等。本文的基本思路就是利用神经科学的启发去改进和提出新的计算机视觉模型。全文内容分为两部分,分别对应识别和注意这两种视觉的基本功能。第一部分提出了一种层级递归结构的神经网络,基于该模型对图像分类、场景标注、EEG信号识别等任务进行了研究。这部分的启发来自于神经系统中广泛存在的递归连接。第二部分从层级特征的角度出发对视觉注意力和显著性进行了研究,提出基于中高层特征的注意力和显著性模型。这部分的启发来自于对注意力研究的一些实验结果的总结。本文的创新之处在于从神经科学的研究成果中提取对计算机视觉有用的结构和原理,基于这些结果提出新的计算机模型,并在各种应用任务中取得了优异的效果。创新点主要体现在以下两方面:提出了一种新型的深层递归结构的模型:递归卷积神经网络,并将该模型扩展到多个任务的应用中,均取得了优异的效果。在图像分类中,递归卷积神经网络在使用更少参数的情况下,取得了比其他先进水平模型更好的性能。在场景标注中,多尺度递归卷积神经网络以端对端的方式处理任务,在准确度和速度上均达到了先进水平。我们还将模型从图像处理扩展到一维序列处理,并应用于EEG信号识别,在相关的数据竞赛中取得了优异的成绩。受相关神经科学实验结果的启发,从层级特征的角度对注意力的计算模型进行了研究。利用特征选择方法分析了各种显著性特征对眼动预测的贡献,并基于选择结果用少数特征构建出达到先进水平的显著性模型。基于中高层特征提出了新的注意力和显著性模型,这些模型相对于传统底层模型能更好地预测眼动。本文的结果支持了利用神经科学的启发去改进人工智能模型的可行性。
其他文献
生物生活化教学就是要求生物教学源自生活,回归生活,从生活中获得提升。以高中生物为切入点,就高中生物的生活化教学策略展开探究。首先对开展生物生活化教学的必要性进行分
<正>本刊讯2014年11月27~28日,四川造纸行业协会、四川省造纸学会在成都市金牛山庄召开了全省造纸行业工作会暨省造纸行业协会、省造纸学会2014年年会。省造纸行业协会代理理
本文采用Beatty报道的非竟争性ELISA结合双抗体夹心法测定了5株单克隆抗体的亲和力常数。直接采用杂交瘤的细胞培养上清,无需纯化抗体,无需对抗原精确定量。而且,方法简便、
糖尿病肾病当归于消渴病之下消,病位在肝肾,病及周身,属本虚标实,虚实夹杂之证,李显筑教授认为,本病治疗宜攻补兼施,重在肾络,久病缓图。
人权保障是几百年以来人类社会共同追求的目标。在押人员作为一个特殊、脆弱的社会群体,其权利保障极容易被忽略。人权保障也已成为当今中国的主流价值,在此背景下,本文分析
个人消费信用的风险管理问题具有重要的理论和现实意义,具有一定的社会历史性,随着人们对个人消费信用的日益重视,关于个人消费信用风险管理问题的学术著作和文章也不断涌现
甘露糖结合凝集素相关丝氨酸蛋白酶2(MASP-2)是补体凝集素途径关键酶,位于染色体1p36上,约20 kb,由686个氨基酸残基构成。通过病原相关分子模式识别病原体,与凝集素结合,以酶
模拟实际火灾环境分别制备了两种短路熔珠,对其金相组织进行了定性和定量分析,研究了熔珠凝固后火场高温火烧对金相组织的影响,提出了鉴别两种短路熔珠的方法,即通过分析组织
广告创意是一个非常活跃的艺术层面,同时也给广告创意人员带来了不便,本文拟就广告创意与民族文化认同、民族文化尊重、中华文化的特性等问题试作论述,使广告创意人员及广告
随着智能手机等移动设备的普及以及移动互联网络的快速发展,基于地理位置的服务得到了广泛的关注与应用。这些服务产生了大量空间文本数据,既包含空间地理位置,同时又具有相