基于深度神经网络的图像分割技术及其在盲人视觉辅助中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:C_k_b
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机硬件资源的高速发展,基于深度神经网络的计算机视觉也得到了充分发展。语义分割作为计算机视觉的一个基本任务,可以实现场景感知。全世界约2.53亿的视障人士,他们的室内外生活和出行需要得到更多的关注。本课题基于深度神经网络,针对盲人日常需求设计了室内和室外的语义分割网络。室内环境下,往往存在光照不均衡、光照不足、物体遮挡和物体歧义性问题。RGB语义分割模型很容易被上述困难所干扰。随着深度相机的出现,将深度图和RGB图像结合,用于室内语义分割的模型也逐步出现。然而在室内环境中,RGB图像和深度图所包含的信息量受光照影响剧烈。并且,RGB图像代表的纹理明暗等细节信息和深度图代表的物体几何形貌的分布模式不匹配。课题提出的ACNet可以动态提取RBG-D特征,解决上述问题。在室外环境下,盲人更需要全方位的环境感知技术。课题设计了 360°全景环带图像语义分割网络。该模型使用了网络适配技术,在普通数据集上训练,在全景图像上测试,达到了较好效果。另外,模型使用的带注意力机制的跳跃连接也增强了模型的细节处理能力。
其他文献
目标跟踪作为计算机视觉领域中的一个重要研究方向,在安全监控、智能交通、自动导航和人机交互等方面都有着现实的研究意义和广泛的应用前景。目标跟踪是指在背景不断变化的
冰雪的融化和积累过程是寒区水文过程中重要的一环,在全球气候变化背景下,寒区具有显著的水文响应特征。有“世界第三极”和“亚洲水塔”之称的青藏高原作为高原寒区的典型代表,其复杂的地形条件和观测资料的匮乏,限制了人类对该地区独特水文过程的研究。本研究以青藏高原南部的雅鲁藏布江流域为研究区,针对高原寒区水文特点,为分布式水文模型CREST添加冰川和积雪冻融模块,扩大CREST模型的应用范围,使其可以在高原
从二维图像中感知深度是计算机视觉领域中的一个重要研究方向,其可以广泛应用于智能驾驶、三维重建、图像分割、机器人视觉等相关任务中。其中,从单张图像中重建深度信息更具
从长远来看,世界经济全球化属于历史潮流。技术的进步使得社会分工中出现了新的生产要素变化:机器人的到来。这种自动化、智能化、虚拟化的生产要素改变了传统的劳动力模型,
油茶属于我国主要木本油料树种之一,以其籽榨取的茶油色清味香,储藏期长,营养价值高,是世界公认的营养丰富和最优质的食用油与保健油,具有很高的经济价值和生态价值。油茶产
具有金属性的微纳米结构器件在现代光学中扮演着重要角色,基于表面等离子激元效应的一系列功能性微纳器件近年来吸引了大量的研究并逐渐获得应用。如何进行高效的金属/介质复合微纳结构制备是其中的关键问题之一。目前大量应用的微纳制造技术如电子束曝光、离子束刻蚀、真空镀膜、气相外延等制作过程需要多道工序配合,制备步骤复杂,容错率低,特别是在制备金属性微纳结构时面临更大挑战。激光直写技术作为近年来热门的微纳制造技
放射性治疗手术是目前治疗前列腺肿瘤一种有效手段。然而,在手术过程中人体的一些生理因素(如呼吸、咳嗽等)会导致前列腺肿瘤的位置发生变化,使得放射源发出的射线无法准确地
MOOC(Massive Open Online Courses,大型开放式在线课程)是一种不同于传统授课方式的新型教学模式,它借助互联网平台,与高校合作,突破时间和空间的限制,面向社会大众开放各类
产品服务系统能够改善制造企业的定价能力和收入模式,提升企业整体的竞争优势,帮助企业在日益增长的全球竞争和以客户为中心的业务环境中实现经营的差异化。制造企业开始重视
网络技术的迅速发展和普及,给人们带来了诸多便利,同时网络安全事件也频频发生。传统网络安全技术例如防火墙、加密和认证等具有静态和被动防守的特点,尚不足以为网络提供全