基于双目视觉的目标6D位姿估计方法研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:wyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术和视觉传感器的发展,二维视觉逐渐延伸至三维空间,目标6D位姿估计技术开始成为视觉研究领域的研究热点。本文主要研究内容:一是创建完整的三维数据集,二是构建完整的位姿估计系统,三是在复杂环境中利用低成本视觉传感器取得最优位姿估计效果。在视觉传感器的选择上,本文选用成本较低的双目相机并利用双目视觉获取图像数据,利用三维表面重建技术来构造三维模型进而建立完整数据集,该数据集用于基于关键点投票的6D位姿估计网络的训练和验证,在位姿测试中通过人为施加扰动和遮挡来评价训练模型的效果。针对三维开源数据集种类和数量稀少、三维标注困难以及数据格式复杂等问题,本文利用双目立体视觉、点云配准和三维表面重建技术对真实环境下的目标物体建立完整的数据集。深度信息的获取需要利用相机标定、立体校正和立体匹配获取视差图,再经过转换获取深度图。三维表面重建需要先利用Ar Uco码检测位姿,获取点云数据、点云配准,然后对点云数据进行法线顶点的建立、泊松重建、孔洞填补等过程生成网格化模型,根据模型获取蒙版和关键点标签,最终建立完整的三维数据集。为了解决旋转空间的非线性问题,本文分为两个阶段来构建基于关键点投票的6D位姿估计网络。第一阶段主要通过基于残差结构的主干网络执行语义分割和向量场预测两类任务,利用随机抽样一致算法对每个像素的预测向量进行关键点假设,并根据假设的关键点进行投票选出8个2D关键点。第二阶段是根据三维模型中预设的3D关键点找到与2D关键点的映射关系,最后通过Pn P算法进行位姿求解,最终获取目标6D位姿。本文对扁平包装盒、立体包装盒、椭圆包装盒和塑料软管包装盒构建三维数据集并进行位姿估计网络的训练,经验证模型的平均ADD指标为97.01%,平均2D Projection指标为94.78%。除了在测试集中完成模型测试之外,本文还对目标物体施加包括复杂场景、手部遮挡以及图像残缺等扰动,实验验证了6D位姿估计方法的有效性和鲁棒性。
其他文献
青春期是心理问题的高发期,其中心理疾病和自杀问题尤为突出。现有利用计算机相关技术解决心理预警问题的方式主要有两种,一是通过计算机辅助用户完成各类心理测试来发现用户心理问题,二是通过Fast Text等现有主流文本分类模型对用户对话做分类来识别用户的心理问题,前者预警效率低,后者预警准确率低。在青少年心理预警领域,本文引入BERT-Text CNN及其改进模型来提高现有主流分类模型的预警准确率,同时
为探讨高中生时间管理倾向对学习成绩的影响,以及学习投入的中介作用,采用时间管理倾向量表和学习投入量表对山东省青岛市某中学809名高中生进行问卷调查,并收集他们的期末考试成绩。结果显示,高中生时间管理倾向和学习投入均处于中上水平;时间管理倾向及其三维度和学习投入及其三维度与学习成绩均呈显著正相关,时间管理倾向及其三维度与学习投入及其三维度均呈显著正相关;高中生时间管理倾向显著正向预测学习成绩,学习投
党的二十大报告提出中国式现代化是全体人民共同富裕的现代化。立足于区域发展不平衡的现实国情,提出中国式现代化要以区域现代化为子集,利用区域现代化积累现代化实践经验,经过区域现代化的初级阶段以实现全面现代化。数字经济推动新一轮技术革命和产业变革的时代背景下,要求形成协同推进的区域现代化,形成具有“数字化特征”的区域现代化,要求不断延伸区域产业发展和消费市场外延。推进区域现代化应当推进以构建现代化经济体
铁路新一代移动通信系统将采用5G-R系统。5G系统采用大规模天线,具有大带宽、高频率等特点,因此5G-R基站的用电量远高于GSM-R基站。为此从硬件、软件两个方面对5G基站节能技术进行分析,并对5G基站新工艺、新材料、仿生外观、符号关断、通道关断、载波关断和深度休眠等节能技术在铁路中的应用进行适应性分析;提出基于5G-R无线组网和话务量的节能方案,以及基于行车间隔的智能化节能方案,可为未来5G-R
后脱贫时代,防止返贫、减少结构性贫困是长期减贫政策的重点。农村低保作为兜底保障措施,能否有效改善贫困家庭经济福利至关重要。文章构建了一个多维贫困分析框架识别农村贫困人口,基于2015~2019年中国家庭金融调查(CHFS)数据,利用固定效应模型和倾向得分匹配双重差分法,系统考察了农村低保对贫困家庭不同类型消费的影响。研究发现,农村低保显著提升了贫困家庭的家庭设备服务、教育文娱和医疗保健支出,且对多
如何通过图像获取场景环境的三维信息一直是计算机视觉领域的热点之一。图像三维重建作为一项从二维图像中重建出场景三维信息的技术,受到了学者们的广泛关注。目前,大部分基于图像的三维重建是以点特征为基元进行研究,其生成的点云模型数量庞大、点与点之间几乎不存在几何拓扑关系,既无法表述场景的三维结构信息也不利于计算机后续的存储和计算。同时,在弱纹理的场景下,点特征数量有限,容易匹配错误,导致重建效果不理想。相
<正>小时候,看过一本讲述京张铁路的小人书。因我儿时识字不多,把居庸关的"庸"字认成"唐"字读,成为笑料。一晃几十年,退休后的第一个旅游地,我就定下游北京的居庸关。这是四月暮春。我迈着大步朝居庸关楼直扑去,一口气登上关楼。眼前居庸关云霄阴灰,风却有力有劲,连绵群山已开始披些浅绿,相杂其间的仍有许多不肯服输的枯黄色灌木,给峻峭的山势增加了苍凉感。居庸关楼进进出出,上上下下的男女可用"蜂拥"二字概括。
会议
本文采用我国2013—2020年30个省(区、市)的面板数据,运用双向固定效应模型,实证分析数字经济对共同富裕的影响。结果表明:第一,数字经济显著促进了共同富裕,通过替换被解释变量、核心解释变量以及考虑可能存在的内生性问题后,结果依然稳健。第二,数字经济通过推动人力资本、技术创新与产业结构升级提高了共同富裕程度。第三,数字经济各分指标均显著促进了共同富裕,既促进了富裕度又促进了共享度。第四,数字经
立足于生产要素的特征,按农业经济、工业经济、数字经济的历史脉络,结合中美两国数字经济发展历程,提出“网络化—平台化—智能化—智慧化”的数字经济一般发展逻辑,基于核心生产要素的作用、生产力的演进,探讨四个阶段的经济内容、特征及其相互关系。研究发现:网络化阶段以建设完善各种类型网络为主要内容,平台化阶段则是以各类平台的建设、完善和运营为主,智能化阶段是通过发展机器智能代替人的体力劳动,智慧化阶段则是提