【摘 要】
:
复杂多变的光照给计算机视觉领域的研究带来了许多挑战,特别是对于实时单目视觉定位与建图算法(SLAM)。近年来,SLAM系统在普通光照环境下已经可以完成精准的定位建图任务,但在弱光照环境或者阴影环境下,前沿的SLAM系统也往往因为其视觉前端光照鲁棒性不足而导致跟踪出现问题。对于弱光照环境下的SLAM视觉前端鲁棒性问题,本文首先通过改进现有的成熟SLAM系统的视觉前端,提出了一种基于双特征算法的图像特
论文部分内容阅读
复杂多变的光照给计算机视觉领域的研究带来了许多挑战,特别是对于实时单目视觉定位与建图算法(SLAM)。近年来,SLAM系统在普通光照环境下已经可以完成精准的定位建图任务,但在弱光照环境或者阴影环境下,前沿的SLAM系统也往往因为其视觉前端光照鲁棒性不足而导致跟踪出现问题。对于弱光照环境下的SLAM视觉前端鲁棒性问题,本文首先通过改进现有的成熟SLAM系统的视觉前端,提出了一种基于双特征算法的图像特征提取方法,确保系统在弱光照环境下也能提取到足够的特征信息以完成帧间匹配。通过结合两种点特征对生成轨迹进行束调整,提升了后端优化线程的性能。并且针对一些极暗环境下获取的图像,本文设计了一种基于亮度补偿的图像帧预处理方法,保证系统正常运行。通过在公开数据集的实验表明,本文提出的算法在一定程度上提高了SLAM视觉前端在弱光照环境下的鲁棒性,并且保留了其在普通光照环境下的优异性能。对于阴影环境下的光照鲁棒性问题,本文同样对SLAM视觉前端进行了改进,设计了一种能有效抵御阴影干扰的视觉跟踪方法。通过在HSI颜色空间检测环境阴影,并使用基于子区域匹配的自适应阴影去除算法,消去图像帧中的大部分阴影,保证视觉前端提取足够的特征信息。对于残留的阴影边缘部分,本文提出了一种异常特征点筛除算法,将阴影对图像帧间关联的影响降至最低。我们同样使用两个公开数据集对本部分方法进行了实验评估,结果也符合我们的预期。相比于传统方法,本文算法对于自然环境中出现的阴影具有更强的鲁棒性。
其他文献
管线铺设是地浸矿山井场设计中的一个重要环节,开发基于Web GL的井场管线铺设系统能够在三维场景下辅助技术人员进行管线铺设,为管理者的决策提供数据支持,具有一定的实用价值。本文首先对国内外井场管线铺设系统的发展现状进行了分析,研究了相关理论与技术。通过需求分析将系统划分成了地表模建模、地表交线铺设、井场管网规划、管线数据统计等模块。为实现地表建模模块,提出了一种改进的距离反比插值算法,首先使用K均
自然语言处理技术已被广泛应用于很多领域,其中也包含对电影剧本的分析。近年来看电影成为人们常见的休闲娱乐方式,人们总是希望在看电影之前更多的了解电影内容,判断是否有自己感兴趣的片段,并且希望可以快速的定位到该片段。但目前常用的视频播放软件并不能满足人们这样的需求,不能进行片段的索引,在对片段进行定位的时候人们只能手动的快进或后退拉动进度条,有时候可能会错过自己想看的内容。因此,为了能让用户在比较短的
肿瘤转移是其高死亡率的关键。越来越多的学者开始关注肿瘤转移的研究,并在这一领域取得了令人满意的成果。乳腺癌是女性最常见的恶性肿瘤。它的高死亡率,主要是由于转移和复发造成的。侵袭性和非侵袭性乳腺癌患者需要不同的治疗方法,因此迫切需要预测工具来指导临床决策,以避免非侵袭性乳腺癌的过度治疗和侵袭性病例的治疗不足。测序时代的到来允许在分子水平上研究肿瘤转移,这对于了解肿瘤转移的分子机制、识别诊断标志物和治
在软件工程领域,学者们对代码克隆检测技术的研究从来未停止过。代码克隆检测的目的是为了找出软件系统中存在的克隆,通过分析克隆对软件质量的影响来利用有益克隆,同时对软件质量造成威胁的有害克隆进行规避或重构,从而提升软件系统的质量,提高软件人员的开发效率并减少软件维护成本。到目前为止,在克隆检测领域不同方法和技术的积累,主流检测技术分为基于代码语法结构的检测和非语法结构检测。基于非语法结构检测又分为基于
同步协同搜索系统是指支持两个或两个以上的具有类似信息需求的用户进行实时交互以执行协同搜索的系统。通常,同步协同搜索系统会提供一个社交引擎以允许同一组内的用户进行通信。但是,当社交引擎中的用户人数不足时,社交引擎就会遇到冷启动问题,无法很好地执行协同搜索。在本文中,我们提出了一种新颖的基于智能问答的同步协同搜索系统。我们在社交引擎中加入智能问答引擎Infobot以支持用户和搜索引擎之间的实时交互,同
相对基于光强、光谱等信息的传统光学成像与测量技术而言,偏振成像和偏振测量技术利用光的偏振特性获取目标场景的偏振信息实现多维尺度的目标识别与探测,是一种高效的光学探测、识别技术。特别地,偏振成像技术与数字处理技术相结合可有效解决传统光学在目标检测和识别领域无法解决的问题,拓宽偏振光学的研究领域和应用场景。在各类偏振成像系统中,基于分焦平面(Division of Focal Plane,DoFP)线
目前在工业生产和制造领域,大量的零件X光影像数据都是以实体胶片的形式存放,而不是数字影像,不仅导致管理成本的不断增高,且无法挖掘存在的数据价值,造成了巨大的浪费。随着生产的推进和发展有更多的X光实体胶片产生,给企业的数据存储以及管理带来了较高的成本以及资源浪费,且经实体胶片转化后的数字影像也无法得到有效的管理和利用。最近几十年以来,计算机技术及其应用的高速发展,工厂使用计算机进行数字化信息管理的优
随着定位、导航、轨迹分析和轨迹预测等基于位置服务(LBS)的广泛应用,越来越多的智能手机用户安装基于位置服务的APP,这类APP产生的位置数据能够为交通研究者带来大量信息。如今,基于位置的服务已经成为广大交通研究者不断研究和突破的技术课题,而智能手机产生的位置数据与电子地图的校准则成为这些技术的核心环节。利用智能手机获取位置信息有三种方式,分别为手机GPS、手机基站以及利用Wi-Fi进行定位。然而
逼真的声音传播效果可以提高虚拟现实系统的沉浸感和交互性,声音传播模拟技术现已成为计算机图形学领域的一个重要分支。目前计算机图形学领域的声音传播模拟技术较少甚至没有考虑水下声传播的特殊性,因此难以直接应用于水下场景。本文提出了一个针对水下特殊环境的声音传播模型。将水声学领域中适用于计算水下声场的简正波方法与计算机图形学中可以捕捉场景几何信息的射线跟踪方法进行耦合。同时基于阈值参数控制射线模型的切换以
自动检测出通过一扇门的人员的身份和移动方向对于日常生活中很多的场景都具有实际意义。例如,它可以帮助跟踪多个房间的中工人分布情况,更好地确定任务分配。然而,现有的解决方案通常需要在很多的限制下才能发挥很好的效果,这在很多工业工厂是很难满足的。例如,基于计算机视觉的解决方案需要摄像机和人脸之间的视线之间不被物体遮挡;而生物识别技术需要非常干净的指纹等特征才可以发挥不错的作用。在本文中,我们利用RFID