基于ORB的图像特征提取架构研究和ASIC设计

来源 :浙江大学 | 被引量 : 1次 | 上传用户:lihonggeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉同步定位与地图构建(Visual Simultaneous Localization And Mapping,VSLAM)技术是机器人在未知环境中利用图像传感器采集图像信息以进行定位导航、姿态估计和地图绘制的重要技术手段。其中,图像的特征提取作为VSLAM前端视觉里程计中重要环节,其提取特征点的效率和质量将直接影响整个系统的性能和表现。而特征提取算法复杂、计算密集导致其很难能满足嵌入式场景下高实时性、高能效、低成本的需求。因此本文重点研究效率较高的ORB(Oriented FAST and Rotated BRIEF)特征提取算法,并基于此提出一款高性能、低成本的特征提取专用集成电路(Application Specific Integrated Circuit,ASIC),从整体硬件架构和硬件单元设计两个层面对其进行优化。论文的主要内容和创新点如下:1.本文对特征提取算法研究现状进行了深入的分析,对ORB特征提取算法进行了详细介绍。基于硬件设计的思想,分析ORB特征提取算法的算法规律,提取计算密集、不利于硬件实现的部分,指出可以优化与改进的地方。2.本文提出一款基于流式架构的特征提取专用集成电路,针对流式架构的资源利用过多、功耗过大两个问题,分别从硬件架构和硬件单元设计两个方面解决。在硬件架构方面,提出多层图像金字塔共享计算资源的架构,可以在不丢失或少量丢失精度的情况下减少计算单元的份数;基于桶的数据流使得图像特征点分布更为均匀,也简化了部分算法的实现。在硬件单元设计方面,对FAST特征检测和Harris角点评分等单元进行算法改进,保证特征点数量的稳定且减少了后续计算单元的激活次数;对图像金字塔、图像一阶矩、特征点主方向等单元中的复杂操作进行优化,有效减少了硬件的面积成本和功耗损失。3.针对流式架构的特征提取电路中行缓存面积占比过大的问题,利用DPCM图像压缩技术,大大减少了行缓存的数据位宽。同时,提出DPCM解压与线性运算可置换定理,并将其分别应用于图像金字塔、图像滤波和图像一阶矩单元中,减少了硬件单元的数据路带宽,也削减了DPCM压缩带来的误差累积。并且该思想不仅能应用于此电路,还可以推广至其他以线性运算为主的流式架构电路之中。4.对特征提取算法改进和硬件实现效果进行模块级和系统级的验证与实验。结果证明其功能稳定,表现优秀,整个系统能够保持良好的追踪性能。使用TSMC 28nm工艺,对电路进行综合分析和后端版图实现,本文提出的特征提取专用集成电路总面积约2.225mm~2,等效门数1823.7k,在500MHz的工作频率下,可以以241.1FPS的帧率和90.1mW的功耗处理1920×1080的全高清图像。
其他文献
公路的安全通畅是一个国家经济发展的重要保障,而路面的缺陷如裂缝、坑洞及绿化带区域的植物生长超过护栏遮挡路肩的情况等,都潜藏着交通事故的隐患。及时找出缺陷并加以修复就显得尤为重要,但对缺陷的排查却非常消耗人力物力,路面缺陷识别逐渐成为研究的热点。传统的数字图像处理方法虽然因为流程较短因此速度较快,但都有着不足之处,鲁棒性不强。而近年来在计算机视觉领域,深度学习的方法在各种应用中都有显著的成果,在路面
学位
随着无线通信技术的迅速发展,通信用户数量的不断膨胀,通信系统的传输效率以及传输功率效率的要求越来越高。毫米波以其可用频谱资源丰富的特点,成为了新一代通信的重要技术之一。射频功率放大器是无线通信系统必需的组件,为了降低传输系统的成本,并获得理想的功率效率,毫米波系统常使用具备高功率增益的非线性功放。在毫米波传输系统中采用恒包络调制技术可以有效避免功放工作在非线性区而带来严重的波形失真、频谱泄漏等问题
学位
随着视频平台用户生成内容的数量爆发式增长,通过视频内容在视频库中查询相关视频的视频检索算法被广泛应用在版权保护、新闻事件聚合和个性化推荐等场景中。视频检索是一个包含同源复制视频片段检索和事件级视频检索的多维度细粒度的任务,非常具有挑战性。现有的视频检索相关工作缺乏对视频结构信息的提取和对语义信息的理解。同时,多数工作仍然依赖于人工标注的相关视频对,不利于泛化性能的提升。本文提出了全新的视频检索架构
学位
表情是情绪的外在表现形式,在人类日常生活中具有重要作用,相较于语音、语言等能够传递出更多的信息量。表情识别是让人机交互过程更加人性化、智能化的一种方式,能够让机器捕捉到人类的情感信息,完善交流过程。由于不同面部表情之间的特征相似性高,数据集逐渐从实验室走向复杂的真实环境之中,这些都使得面部表情自动识别的理论研究和项目落地过程中充满了难点。同时,流行的深度学习算法在训练阶段对内存和计算机算力有较高的
学位
随着移动互联网技术的飞速发展,支持定位导航服务的应用软件层出不穷。现阶段,应用于室外定位的主流技术GPS已经发展得相当成熟。但是,在复杂的室内环境中,由于受到建筑物或其他各种物体的遮挡,卫星信号会发生严重的衰减,致使GPS技术无法正常使用,因此对高精度室内定位技术的研究显得尤为重要。尽管已经构建了很多与室内定位有关的解决方案,例如,基于RFID、WIFI、Zig Bee等无线技术,但是上述这些室内
学位
<正>本文采用静电喷雾技术,以聚醚砜(PES)为原料,二甲基亚砜(DMSO)为溶剂,通过向静喷溶液中添加亲水性聚合物聚乙烯醇(PVA)、不良溶剂丙酮和乙醇来控制聚醚砜微球的结构。研究表明:亲水性聚合物PVA少量添加时,作为致孔剂使用,制备
会议
神经信号是一种大脑在生理活动时会产生的蕴含大量信息的生理信号。获取神经信号并分析其中的信息,可以帮助探索生命活动、辅助临床诊断、进行疾病监测等。神经探针是一种连接大脑与外部设备的接口。性能良好的神经探针可以在引起尽可能小的损伤的情况下,记录下脑电信号并将其传输到外部设备进行处理。神经探针作为多种脑电极中,植入位置最深、获取信号质量最高的一种,具有非常广阔的应用前景。对于神经探针进行多功能的集成,也
学位
随着计算机视觉与人工智能技术的发展,近年来目标检测等视觉任务的性能得到了很大的提升。相较于目标检测任务包围框级别的感知与语义分割任务逐类别的分割,实例分割任务要求预测每个物体各自的像素级前景掩码,由于其预测结果有着较高的表示复杂度,如何协调细粒度实例表达与模型推理速度两者的关系成为了一大研究难点。另一方面,在视频感知相关的实例分割与跟踪任务上,端到端一体化方案以联合优化的形式同时执行多项子任务,考
学位
随着计算机图形学的迅速发展,真实感渲染技术在生活中扮演越来越重要的角色。真实感渲染,即在计算机上生成和模拟与现实世界的物体尽量逼真一致的图形,这需要很好地还原材质本身的反射特性。生活中大部分物体是颜色和纹理丰富且不透明的材质,这些材质的表观反射特性可以用SVBRDF(Spatially-varying Bidirectional Reflectance Distribution Function)
学位
在新时期发展背景下,着重强调了当前社会发展的关键方向,全面推进了社会发展进程,并且也落实安全稳定工作,这是当前社会发展的关键目标及任务。基于此,本文主要以高校安全管理为基础,阐述当前高校校园安全管理存在的常见问题,并进一步阐述有效开展高校校园安全管理的对策,以此来促进高校实现可持续及健康发展。
期刊