特征一致性在场景感知上的研究及应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:jyx781004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉领域,特征一致性在基于学习的众多方法中有广泛的应用场景和显著的性能提升。本文通过利用特征一致性具体实现像素级场景感知任务——显著性物体检测任务和涂鸦标注语义分割任务。作为计算机视觉领域中基础且极具挑战的任务,像素级场景感知通过将场景中所有物体进行逐像素的类别标注来实现感知的目的。具体地,显著性物体检测根据显著性将图像划分为显著性物体和背景两种区域。显著性检测的结果可以应用于众多计算机视觉任务,例如图像大小调整,缩略图制作,图像分割和对象检测。由于其重要性,显著性检测已经引起了广泛的研究关注,许多算法最近被提出。这些算法中最为优秀的通常都使用基于特征一致性的扩散理论,然而他们对用于扩散矩阵定义的特定特征空间和尺度敏感。本文基于数学分析的扩散过程的工作机制,表明扩散过程实际上是基于扩散图计算节点相对于种子的相似度。根据此分析,我们提出了超级扩散,这是一种新颖的基于包容性学习的显著物体检测框架,它通过集成大量的特征空间,尺度,甚至来源于非扩散方法的显著物体检测的特征,由监督学习确定用于集成的最佳参数的闭式解,最后计算得到最佳性能从而获得鲁棒性。与二值分割的显著性物体检测任务相比,多类感知的语义分割任务更具挑战性。由于不需要高质量的标注信息就能获得可观的分割表现,涂鸦式标注下语义分割任务在近些年获得了广泛关注。由于涂鸦式标注的稀疏性,许多方法被提出来解决直接使用涂鸦式标注训练导致的低效性和错误率。然而,这些方法并没有从训练层面来解决问题。本文在直接使用涂鸦式数据集而不利用额外信息和其他中间处理来实现语义分割任务。提出了一个整体的解决方案,通过最小化熵和网络表示上的随机游走来降低不确定性。给定随机游走的概率转移矩阵后,我们通过在特征空间中的自监督学习进一步训练网络,使相关图像之间的预测具有一致性。我们不仅在主流涂鸦式数据集上对各种方法进行了评估,还通过随机缩短和丢弃图片中的涂鸦来修改数据集来验证我们提出方法的鲁棒性。实验结果表明提出方法的优越性,其性能表现甚至与一些全标注监督的方法相当。最终,从较简单的显著性物体检测任务到复杂的涂鸦式语义分割任务都应用了特征一致性,从模型表现到鲁棒性都证实了特征一致性思想的泛用性以及可靠性。
其他文献
随着网络购物的普及,面对琳琅满目的商品,消费者愈发感到难以取舍,网络测评作为新兴产业应运而生。测评主体以视频、文章等方式对若干商品作出评价,为消费者提供消费建议,以回应网络消费时代的现实需求。网络测评关系消费者、测评主体与被测评主体等主体的切身利益,目前对其规制虽有司法诉讼、行政监管、行业自律等几种路径,但仍存在完善空间。应当拓展规制路径,健全投诉监督机制与公益诉讼机制,加强消费者权益保护;明确相
期刊
布朗族——大自然孕育的民族,是云南省世居民族之一。在其所处的地域环境、人文风貌及社会生活的影响下,布朗族人民创造了风格独特的布朗族民间舞蹈。它将肢体语汇作为载体来展现布朗族舞蹈的魅力,传递其民族情感与精神,体现其民族文化心理。本文以布朗族民间舞蹈作为研究方向,从萃取民间舞蹈中的代表性元素、运用重构创新表现形式及音乐编舞法促进舞蹈与音乐的内在关联,以此实现对布朗族民间舞蹈“宰蹦”“蜂桶鼓舞”“蜡条舞
学位
<正>一、引言洞庭湖生态经济区涵盖共33个县(市、区),总体规划面积约为6.05万km~2,市级地区囊括湖南省的岳阳、益阳、常德3市,以及湖北省荆州市,其中湖南省内面积4.68万km~2,共25个县市区。作为长江中下游的重要生态屏障,洞庭湖生态经济区肩负着维护长江流域防洪安全、保护水生态安全以及维持国家粮食安全的艰巨任务。近年来,湘、鄂两省认真贯彻落实习近平总书记“共抓大保护、
期刊
“玩”是人类甚至于动物从出生就拥有的一种天性,也是人类发展的必然产物。对于人类而言,游戏是一种很有效的学习方式。因此,通过游戏的方式并融入带有学习性、思考性的社会问题,对于人们来说接受度能得到大幅度的提高。对于本来就对游戏有兴趣的大量青少年以及青年群体,也能通过游戏的方式提升他们对社会问题的思考,提高他们对社会关注的积极性。目前,热带雨林和热带森林文化具有独特又丰富的内涵,它以不可思议的神奇、美丽
学位
随着网络时代的到来,越来越多的小程序、软件层出不穷,但是在系统开发过程中,却极易出现问题,比如软件闪退、手机黑屏、功能失效等问题,这些都需要开发人员在开发中注意、在后续不断查找问题解决问题,也需要测试人员全面测试提交问题点,还需要对用户出现的问题及时反馈,只有这样才能给用户带来愉快的使用体验。Log作为记录软件使用过程中的工作日志,能够方便开发者根据日志内容查找问题原因,帮助开发者解决问题,所以本
学位
构建高效的开发管理体系,已成为众多企业的迫切需求。SR公司作为我国少有的拥有完全自主产权变速器产品的生产企业,研发投入不断增加,但由于开发管理体系缺少系统性,开发整体效率较低、成本较高、周期过长,影响到公司的市场竞争优势。因此,公司迫切需要对开发管理体系进行优化。本文基于集成产品开发(IPD)体系,针对SR公司开发管理中存在的问题,对其进行优化改进。首先,针对SR公司开发管理现状,从开发战略、开发
学位
博物馆作为一种面向大众、服务社会、适应时代的需求并且具备一定社会教育使命的建筑,国内外的学者对其研究一直维持着相对较高的热度。而情感化设计一词是由美国著名的认知心理学家唐纳德·A·诺曼提出的,诺曼教授从认知心理学角度将其分为三个不同的设计层面,分别是本能层、行为层、反思层。本能水平的设计关注的是外形,行为水平的设计关注的是操作,反思水平的设计关注的是形象和印象。根据博物馆展陈空间的特点与情感化设计
学位
近年来,VR/AR,自动驾驶和智能机器人领域的飞速发展,离不开三维场景的识别和理解任务。对于上述领域来说,识别和理解三维场景任务就像视觉系统一样,指导着机器与三维现实世界进行交互,如果视觉系统能很好的识别与理解场景,那么对后续的交互算法将带来极大的帮助。经典的场景识别和理解任务有语义分割,目标检测,实例分割等,这几个任务是对场景的不同层次的理解。语义分割是识别场景中每个点所属的语义类别,目标检测的
学位
云南省临沧市耿马傣族佤族自治县地处中国西南边陲,是我国傣族主要聚居地之一和傣文化的主要传承区之一。由于其跨境而居的地域环境和社会历史变迁等因素,至今保留着与其他傣族地区同中存异的舞蹈文化特征,具有鲜明的地域特色,是灿烂的傣民族历史文化的不可缺少的重要组成部分。笔者以耿马傣族代表性民间舞蹈“古乐舞”“蝴蝶舞”“紧那丽舞”为研究内容,对其生态环境、历史文化、原始信仰、动律形态、动作构成等进行分析,在保
学位
随着人工智能的发展,作为自然语言处理的核心任务之一的对话系统受到越来越多学者和专家的重视。近年来,智能客服、聊天机器人等智能产品繁荣发展,也体现出人们在实际生活中对智能对话系统的需求。对话系统可以分为以完成具体任务为目的的任务导向型对话系统和提供闲聊服务的非任务导向型对话系统(也叫开放域对话对话系统)。为了使机器像人一样在聊天中保持个性一致,个性信息引导的对话系统开始出现。个性信息可以分为键值对表
学位