基于One-Shot Learning的场景识别技术的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：cynthializzu

【摘要】

：

【作者】

：

段云志

【出处】

：

电子科技大学

【发表日期】

：

2020年01期

【关键词】

：

元认知深度估计自适应视觉定位匹配网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于视觉的场景识别是未来智能感知的一个重要技术,其支撑了包括自动驾驶,智能制造,智能交互等多个领域。现有的场景识别技术主要还是依赖于大量的传感器设备,不能完全通过处理视觉信息来进行。随着机器学习,计算机视觉,人工智能等技术的成熟,基于视觉的场景识别技术已有了飞速的发展。但是目前的场景识别技术是一种点对点的任务映射,需要大量的数据训练才能识别单一的某个任务。针对这个问题和调整,本论文提出了一种基于类脑计算的智能化深度学习网络,通过类脑的方法来完成场景的识别任务,并且网络模型可以快速的迁移到陌生的场景中使用。在本文中我们以场景识别中的智能视觉测距和视觉定位为主要研究切入点,基于元学习网络中的One Shot Learning(OSL)方法,提出了基于OSL的自适应深度估计网络和基于OSL的记忆片分割匹配模型定位方法。两个模型的输入信息均为视觉图像,深度估计网络可以得到视觉中的每个目标的检测框位置、类别信息、距离信息。视觉定位方法可以得到对应的地理位置信息。相较于现有的视觉测距和定位方法我们引入了类似大脑元认知中的记忆认知和认知调节两个功能来搭建模型,不仅大大增加了模型测试准确度,同时使得模型具有强迁移能力,可以在完全不训练新场景数据的情况下进行有效的测试。本文的主要贡献与创新点包括:1.提出了基于OSL的自适应深度估计网络,可以并行完成包括对视觉信息的物体识别、检测框识别和距离测量等多个任务。本文所设计的视觉估计网络通过记忆存储和元控制门限两个部分来拟合大脑的元认知工作过程,是一种类脑的深度网络架构。通过本文的视觉测距方法可以显著降低传统方法的测试误差,同时由于元认知具有迁移特性,因此本文的视觉测距模型在新的数据集上完全不需要训练也可以取得一定的测距效果。2.针对目前视觉定位模型迁移性较差的问题,提出了基于图像地理位置定位的记忆分割匹配网络模型。记忆分割匹配网络的灵感来源于生物记忆检索机制。因为长短期记忆网络具有类似哺乳动物脑海马体中的定位导航功能,所以我们用其来提取视觉的定位信息,以匹配的形式输出地理位置并且加入了隐马尔可夫模型来提高模型的准确度。基于海马体的定位系统具有一定的元认知能力,因此可以在不训练的情况下完成陌生场景的定位工作。3.针对视觉测距模型我们在KITTI2012和CityScapes数据集上进行了训练与测试。我们发现在KITTI2012数据上深度估计网络在100米视觉范围内的平均距离误差仅为2米,平均距离误差率为8.8%。相比于传统方法测距效果提高了22.8%。在CityScapes数据上100米视觉范围内平均距离误差为4.5米,而现有的最优方法误差为7.5米。测距误差要远小于目前已有的方法。同时我们使用KITTI训练集训练模型并在CityScapes下进行测试,在完全不训练情况下,100米视觉范围内平均距离误差仅为8.7米,测试结果甚至优于目前部分其他论文的测距方法。4.针对视觉定位方法,我们测试了三个数据集。在Oxford Robot Car测试集上,在40米误差内,可达到96.6%的测试准确率。在Google Street View测试集上,由于输入了不同视野方向的视觉信息,在50米阈值范围内甚至可达到97.3%的定位准确率。同时为了验证模型在新的数据上的迁移能力,我们使用Oxford Rbot Car下训练的模型在Campus数据上进行了定位测试,通过测试我们发现在10米阈值范围内,我们的匹配定位方法在完全不训练Campus数据的情况下可以达到91.9%的定位准确度,相比于训练的结果仅仅降低了1.3%。

其他文献

华人首富的财富真相

中国的改革开放20多年，富豪的崛起，是近十多年前的事情，早在1995年，《福布斯》在中国首次推出大陆龙虎榜17人——严格意义上的第一张首富排行榜，接下来，无论是胡润百富榜，还是《新财富》华人富豪榜和《财富》排行榜，其相同点是财富数额的升级速度不断加快，入榜的门槛也日益提高，以《福布斯》为例，1999年排出50名富豪，第50名仅拥有5000万人民币，2000年第50名是4亿人民币，2001年第100

期刊

《华人首富》华人首富故事中国改革开放新书介绍

吉化甲基香兰素生产创历史最好水平

期刊

吉化集团公司甲基香兰素生产能力产品质量

枳术肃降汤治疗脾气虚型功能性便秘疗效的临床观察

目的:功能性便秘是消化系统疾病中的多发病,且发病率有着逐渐上升的趋势,西医治疗上主要以渗透性泻剂为主,辅以促进胃肠动力药物,虽然见效较快,但存在容易复发的问题,中医在治疗有着因人制宜的优势,且目前中药颗粒剂有效的解决了煎药问题,但由于中药口味差及服药周期长,导致患者依从性较差。从师期间,发现导师自拟方对于治疗功能性便秘周期较短,且患者反映药物口味较好的特点,故通过研究,采用导师自拟方枳术肃降汤治疗

学位

脾气虚型便秘功能性便秘枳术肃降汤临床疗效

优质早稻“96—18”三种不同育秧方式的增产效应

优质早稻“96-18”是我所承担“国家早稻品质改良科技产业工程”的一项研究成果，具有产量高、品质优、口感好、生物学特性结构合理等特点。为发挥该品种的最大增产潜力，2001年

期刊

96-18品种产量早稻育秧方式增产效应

高等职业教育标准化通识课程建设探讨

摘要：如何开设具有职业教育特色的通识教育课程，已受到越来越多高等学校的重视。本文通过课程改革，将标准化这一工程技术通用语言，建设成为高职院校各专业的通识教育课程。文章详述了标准化通识课程的建设意义、建设目标和内容、建设思路及方法、建设特色。　　关键词：高职；通识教育；课程；标准化　　中图分类号：G712 文献标志码：A 文章编号：1674-9324（2018）11-0261-02　　通识教育是以人

期刊

高职通识教育课程标准化higher vocation educationgeneral educationcurriculumstandardizati

基于深度强化学习的信号灯自适应决策

城市交通贯穿于城市公共空间的各个区域,经过长期发展,已经形成较为完善的格局,提高了居民的出行效率。但随着经济的发展和城市化进程的加快,城市人口及人均汽车保有量快速增长,交通拥堵问题日趋严重,交通不畅、运输效率低下、环境污染等问题日益严峻,严重影响了城市的可持续发展。交通信号灯的自适应控制能够有效地缓解交通拥堵问题,但以往的交通信号灯控制方法通常根据车辆排队长度、交通流量、车道占有比等传统的交通参数

学位

深度强化学习多交叉口信号灯控制Q值迁移多任务学习协同

增强CT和钆塞酸二钠增强MRI对肝细胞癌患者的分期和治疗的影响

目的研究增强CT和钆塞酸二钠增强MRI对肝细胞肝癌患者的诊疗差异,以及此差异所造成的患者肝癌分期和治疗方法的变化。方法通过对在2016年3月-2019年1月就诊于重庆医科大学附

学位

肝细胞癌增强CT钆塞酸二钠增强MRI巴塞罗那肝癌分期（2018版）原发性肝癌诊疗规范（2018版）

新病毒系新兴感染症元凶酶抑制剂成为抗病毒“新宠”

病毒-未来感染的主角，是一类最原始的能自我复制和在严格的宿主细胞内寄生的非细胞生物。病毒(Virus)一词早在公元前1世纪即已出现，其所致传染性疾病如天花、狂犬病、流感、黄

期刊

新病毒系酶抑制剂传染性疾病作用机理抗病毒药物

华西村新掌门吴协恩

3年前,在华西村第六次党代会上,吴协恩全票当选村党委书记。新一代的华西"领军人物"——吴协恩走上前台,华西开始了崭新的"吴协恩时代"。"我只想再干10年" "到这个月底.我上

期刊

邓演达烈士墓的修建经过

1931年12月下旬，邓演达的胞兄邓演存和丘新民、庄明远等人赶到南京，在邓演达殉难处找到遗体，模糊难辨，只有所穿棉衣可证。他们便在管家庄一个小山窝里将他草草埋葬。后来，陈铭枢拿

期刊

邓演达修建烈士1931年陈铭枢墓碑

基于One-Shot Learning的场景识别技术的设计与实现

与本文相关的学术论文