基于对称融合和注意力的图像三维重建研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hymalong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,采取基于深度学习的方法从单张或多张二维图像中恢复物体的三维模型得到了越来越多的关注,是目前计算机视觉领域的研究热点。基于传统方法的三维重建算法存在需要人工参与,算法泛化性不高等缺点,因此基于深度学习的三维重建是目前的主流方法,虽然目前的方法已取得良好的效果,但在单视图重建时存在先验知识利用不足、图像特征提取不充分、网络易受不平衡数据影响等问题,造成重建的模型存在精度不足、细节信息丢失等现象;在多视图重建时,存在重建结果与视图的输入顺序有关,因模型复杂而训练难度较大等问题。针对以上不足,提出了一种用于单视图和多视图三维重建的统一算法(3D Reconstruction based on Attention and Symmetry Fusion,3D-RASF)。在单视图重建时3D-RASF算法采取对称融合技术来恢复三维物体看不见或被遮挡的部分,以更好地利用很多三维物体本身具有对称性等先验知识;采取基于自注意力的Transformer为图像特征提取骨干网络,并通过通道注意力进行加强重点特征学习,来解决图像特征提取不充分问题;采取新型损失函数更关注于整体重建效果,避免不平衡数据影响。在多视图重建时,3D-RASF算法采取新的多视图体素融合模块,将多个重建体素进行融合,解决了无法并行计算、重建效果与视图输入顺序有关等问题,同时提高了算法的易训练性。单视图重建时,3D-RASF算法在公开基准数据集ShapeNet上IoU评价指标为0.682,在F-Score@1%评价指标上为0.438,并在Pix3D数据集上验证了模型的泛化性。多视图重建时,在ShapeNet基准数据集上2views、3views、4views的IoU分别为0.699、0.706、0.710,F-Score@1%分别为0.452、0.461、0.465,证明了算法有效性。
其他文献
通过在边缘部署存储服务,将云端的数据存储在边缘,以允许终端设备高速访问这些数据,从而降低数据访问的延迟。但在边缘环境中,边缘服务器的内部复杂机制、用户与边缘服务器的距离不同以及动态网络都会对系统的服务质量产生影响。副本选择策略作为一种广泛使用的提高系统服务质量的请求调度方法,通过为请求选择延迟最低的边缘服务器,能够有效降低每个请求的处理时延。然而,现有的基于客户端的分散选择方法因其缺少完整的服务器
学位
核磁共振(NMR)技术是获得生物大分子的结构和功能动态信息的最具潜力的方法之一,特别是在以原子分辨率测量生物大分子的结构和动力学信息方面,但是这一方法的发展受限于核磁共振技术固有的灵敏度较低,难以对浓度较低的蛋白质进行研究。为了提高液体环境下核磁共振技术灵敏度,增强样品的信号强度,本课题研制了一套激光诱导动态核极化实验装置,利用该装置可以在低样品浓度下(微摩尔级别)增强样品的核磁共振信号,有望实现
学位
随着web3.0时代的到来,新闻门户、今日头条和微博等信息发布平台取代了传统媒体。任何用户都可以在这些平台发布和获取信息,造成网络新闻文本数据爆炸增长。来自社交媒体的网络短文本数据沉淀了极具社会价值的信息,但短文本存在口语化、缺失语义和指代不明等问题。如何从海量短文本中实时发现当前最具价值的话题成为了舆情发现系统的难点。针对传统的舆情发现系统在处理短文本时存在文本向量语义缺失、话题发现效果较差的问
学位
增材制造工艺的不断发展给传统制造业的生产模式与生产效率带来了革命性的变化,表面缺陷检测作为增材制造质量检测的关键手段成为增材制造技术研究热点。为了避免当前打印层的缺陷影响后续的零件成形质量,本文利用三维点云数据和深度学习技术,检测出电弧增材制造零件生产过程中的表面缺陷,从而为后期的缺陷处理方案提供重要的参考依据。本文主要有以下点云数据预处理和基于深度学习的表面缺陷检测两方面的研究内容:针对传统点云
学位
知识表示学习是用于知识图谱补全的重要技术。翻译模型作为知识表示学习的代表模型,因其参数少且容易解释,被广泛应用于大规模知识表示学习中。近几年,为了克服翻译模型孤立地考虑各个三元组的缺点,实体的邻居信息被引入到翻译模型中。然而现有模型缺乏合理的邻居选择策略,导致开销过大且容易引入噪声,或者容易遗漏重要邻居。同时,现有模型忽视了邻居作为实体也具有多种属性,只能为每个邻居确定一个固定的权重,无法为邻居中
学位
使用计算型存储设备加速SQL查询是一种有效的途径。由于当前计算型存储设备的处理能力有限,现有方案通常将能明显减少数据移动的过滤算子卸载到计算型存储设备中,然而将所有SQL查询中的过滤算子交由计算型存储设备直接处理会导致较差的性能。针对上述问题,提出了基于表数据特征的过滤算子动态卸载与执行优化(Dynamic Offloading and Execution Optimization,DOEO)方案
学位
图像传感器作为现代光机电系统的核心部件,与其他尖端光机电设备联用可以对图像数据实时采集、处理和传输来反馈控制光机电系统。然而,使用图像传感器进行图像采集时,目前主要还是以人工调焦为主,导致调焦精度和效率较低。此外,现有的图像传感器控制软件大多只支持单一设备的控制,无法直接与其他设备进行联用,造成数据通信效率低下。针对这些问题,本文探索了自动聚焦算法中的聚焦评价函数和聚焦搜索算法两大关键技术,在此基
学位
跨域推荐是致力于解决推荐系统冷启动问题的一类方法,核心思想是借助其它域中的知识为当前域的用户进行推荐。基于嵌入与映射的方法是一类可以利用重叠用户数据进行跨域推荐的方法。这类方法通常利用重叠用户在源域中丰富的交互行为进行偏好建模,然后将该偏好知识传递到目标域中。但此类方法并未考虑到用户目标域交互行为和源域交互行为的时序关系。另外,由于基于嵌入与映射的模型对重叠用户数据量的强依赖,会导致在用户交互数据
学位
神外手术机器人辅助治疗代表脑部疾病现代手术治疗的发展方向,具有稳定、高效、精准、微创等优点。术前规划是神外手术机器人辅助治疗的关键步骤,旨在确定手术目标与手术路径,为后续手术实施提供指导。其中,基于术前磁共振图像的脑标识点精准定位与脑部结构自动分割是关键使能技术,决定了术前规划能否帮助医生准确切除目标,并规避重要脑部结构。深度学习技术在脑标识点定位与脑部结构分割中的研究取得了喜人的进展,但现阶段仍
学位
急性脑梗是一种常见的脑血管疾病,具有高发病率、高致残率、高死亡率、高复发率和高经济负担五大特点。在基于核磁共振(MR)成像诊断急性脑梗病灶时,专家之间存在着较大的主观差异性。因此,开发基于深度学习的急性脑梗病灶自动分割算法,准确地分割MR图像中的脑梗病灶并精确地进行定量分析,对于急性脑梗患者的诊断、恢复和预后具有十分重要的意义。急性脑梗病灶的分割存在数据量小、MR伪影干扰大、标注工作量大等问题,且
学位