注意力选择机制的研究:算法设计以及系统实现

被引量 : 0次 | 上传用户:ewenxj860411
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
注意力选择是人的视觉感知的一个重要性质,人可以很容易的完成一般物体的检测和识别,然而传统的机器视觉却没有办法做到,如何开发拟人的注意力系统是本文的研究重点。现有的模仿人的注意力选择模型主要有自下而上的Neuromorphic Vision C++Toolkit(NVT),SaliencyToolBox(STB)模型等,但其计算复杂度高,无法实时应用;自下而上和自上而下结合的模型,但自上而下部分需要人的参与,且它们不具备学习和记忆的能力。论文在研究现有的模型基础上提出带有学习和记忆的注意力选择模型、具有带有遗忘函数的视觉记忆和能实时运用的时空显著性模型。论文的主要创新包含以下几个方面:1.提出了一种带有学习和视觉记忆的注意力选择模型,该模型包含3个部分,分别为感知映射,认知映射以及运动映射。在认知映射中,我们提出了基于视觉记忆的自监督竞争神经网络和眼球运动估计机制,并且利用增量多层回归树来模拟视觉记忆。该模型能学习不同的目标,对外界环境有自适应的能力,我们的模型被应用于目标跟踪以及机器人自主导航,取得了良好的效果。2.视觉记忆对于注意力选择结果有着很大的影响,然而现有的视觉记忆模型没有遗忘功能,在处理连续不断的图像样本时,会出现速度越来越慢以及记忆溢出的情况。本文提出了一种新的带有遗忘函数的视觉记忆模型:遗忘增量多层分类回归树。该模型可以同时模拟人脑的长期记忆和短期记忆。实验表明,,我们提出的记忆模型具有稳定的规模,较快的搜索速度和较高的准确率。该记忆模型应用在我们提出的注意力选择模型上,实现了有监督的视频编码。3.针对现有的自下而上模型的计算复杂度高问题,提出了一种基于四元数傅立叶变换的时空显著性检测方法。把一幅图像每个像素的值用四元数表示,并利用其傅立叶相位谱来获得时空显著图。实验表明该方法不但比NVT,STB模型更接近人的注意力选择的结果,而且速度很快,能够实时运算。4.将我们提出的时空显著性检测性方法推广到多分辨率下的显著图,提出了层次选择模型来获取一幅图像的树状表示,利用这种表示,可以建立多辨率小波域注意力模型,这种模型可以提升图像及视频编码的效率,从而提高压缩率。
其他文献
真空平板玻璃是新型玻璃深加工产品。作为新型透光保温材料,它以其优良的抗老化性能、保温性能、可见光透过和红外光反射性能而独占鳌头。对真空平板玻璃展开系统的研究,是使
近年来,人民币汇率问题备受国内外学界和实务界的关注,问题的焦点在于实际汇率的变动是促进还是抑制经济增长。到目前为止,无论是理论分析还是经验研究对这一问题均未给出一致答
1,2,4-三氮唑及其衍生物能提供丰富的配位方式,其金属配合物具有特殊的光磁性能,此类金属配合物的合成、晶体结构及其性质引起人们浓厚的研究兴趣。本论文设计合成了三个具有
火炮射击时,为保证车载高炮系统连续射击的精度,其底盘必须处于水平状态。吸取瑞士GDF-001牵引高炮三点调平的成熟经验,提出四点调平原理。分别应用2个调平传感器,经电路和油
甲基丙烯酸甲酯(MMA)是重要的丙烯酸树脂单体,市场应用前景十分广阔。但目前工业生产MMA的主要工艺是以丙酮和剧毒的氢氰酸为原料的丙酮氰醇法,反应过程中还使用高腐蚀性的硫
<正>如果把军事典型报道比作是军事新闻的“航空母舰”,那么人物典型报道可谓是“航空母舰”上的主体。大力宣传报道人物典型,是我军新闻工作者义不容辞的神圣使命。解放军报
纪录片中主要以真人真事为表现对象,真实地记录社会生活、自然环境,其表现形式独特,具有无可争辩、令人信服的真实性和来自生活的特有的艺术魅力。随着纪录片的不断发展和受
随着世界各国对全球经济合作认识的不断深入,全球经济治理的理论和实践取得了很大进展。但同时,目前世界经济面临着一系列新问题,全球经济治理格局正受到前所未有的严峻挑战,
根据是否累及升主动脉可将胸主动脉夹层分离分为Stanford A、B两型。Stanford A型主动脉夹层累及升主动脉,其近端剥离常累及冠状动脉,冠状动脉血管内形成夹层,甚至导致冠状动脉