基于图像编解码的三维物体重建技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:scarllie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习技术的不断发展及相关产业需求的提升,基于图像的三维物体重建技术受到越来越多的关注。目前,主流三维重建多以深度神经网络为技术支撑,通常包含编码器和解码器两个核心模块。然而,由于深度学习技术在三维重建方面的研究起步较晚,重建出的三维物体在局部细节上仍有待完善。鉴于此,以高质量三维重建为核心需求,围绕深度神经网络中的编码器和解码器设计,开展了以下研究:首先,设计了基于多分辨率编码的三维点云重建网络,主要对网络的编码器模块做出改进。在目前的三维重建网络设计中,残差网络(ResNet)被广泛用于图像的特征提取。然后,该编码器只能提取高维低分辨率图像特征,而分辨率过低将直接导致重建后三维物体的局部细节难以还原。为了解决该问题,提出了一个更适用于高质量三维重建的多分辨率图像特征编码器E-Encoder,该编码器能同时兼顾低分辨率的高维特征以及高分辨率的低维特征。此外,为了使高分辨率特征具有全局信息,在E-Encoder中进一步融入注意力机制,并设计三维点云重建网络从单张RGB图像中重建物体的三维点云。实验结果表明,同时兼顾高维和低维特征的编码器E-Encoder能更好地还原三维重建中物体的局部细节。其次,设计了基于地图集解码的多视图三维网格重建网络,并对跨边问题做出改进。由于目前的地图集三维网格重建网络(AtlasNet)只使用倒角距离作为损失函数,而该损失函数只考虑了点云的匹配程度,因此会存在点云匹配正确但网格面匹配错误的问题。为了解决该问题,在倒角距离损失的基础上提出跨边距离损失,保证同一个初始平面被映射在目标模型的连续部位,从而减少网格面匹配错误的情况。此外,为了使重建网络能获得更多图像特征,设计了图像特征融合层网络,支持将多个视图的特征向量进行融合,使得重建网络由单视图重建扩展为多视图重建。实验结果表明,引入跨边距离损失并扩展至多视图重建后的网络,分别解决了网格面匹配错误的问题和因遮挡造成局部细节丢失的问题。
其他文献
核磁共振测井技术是一门崭新的、在二十世纪发展迅速的测井分析技术,它不仅可以对岩石总孔隙度进行计算,还可以定量地计算有效孔隙度、束缚水孔隙度以及渗透率等数据,在储层流体识别、孔隙结构识别与复杂地层油气藏评价等方面具有十分显著的优势,已成为石油勘探测井方面不可或缺的一个重要技术。基于对核磁共振测井相关知识的研究,改进了奇异值反演算法,与联合迭代反演算法和阻尼因子反演算法对比,通过正演模型验证了算法的有
学位
如何从海量的互联网数据中提取出实体关系是信息抽取亟待解决的问题之一。关系抽取包括句内关系抽取和文档级别关系抽取。在文档级别的关系抽取任务中,输入文本序列长且由多句话组成,同时实体往往位于不同句子中,因此需要多句子共同推理才能得出实体对之间的关系。相比句内关系抽取,文档级别关系抽取面临诸多挑战,如文本特征提取不充分、跨句推理能力不足等。对此,研发了融合多维度与上下文特征的关系抽取系统。在该系统中,针
学位
中国式农村教育现代化发展道路需要有自身的理论建构。中西比较维度下对西方农村教育现代化道路与理论的批判与超越成为建构中国化理论的起点,这一维度要求中国式农村教育现代化理论要打破西方意识形态偏见,探索不同于西方的本土现代化模式;以世界先进水平为标准定位教育现代化,积极推进教育强国建设;破除路径唯一性幻象,探索传统与现代共存、乡土化与城市化并进的新型农村教育现代化之路。历史变迁维度下对中国式农村教育现代
期刊
冠心病是最常见的心血管疾病,给居民带来严重的健康问题和经济负担。冠状动脉分段标记可用于冠心病的病理分析,对冠状动脉血管造影图像中不同类别的血管段应用不同权重,计算解剖结构分支的统计数据。冠状动脉分段标记得越精确和细致,越有助于自动量化冠心病的复杂程度,加快医生分析工作的流程时间。目前,大多数基于深度学习的分段标记方法能够自动对冠状动脉完成分段,但是存在分段类别过少的问题,无法识别不常见的分支。冠状
学位
联邦学习允许参与者在不共享数据的前提下协同训练模型,由于其很好地保护了用户数据隐私并打破数据孤岛,逐渐成为了国内外研究人员的关注热点。联邦集成蒸馏(Federated Distillation and Fusion,Fed DF)算法是联邦学习中一种现有的高效中心聚合算法,该算法以外源数据为蒸馏数据,对初步参数平均聚合得到的模型再蒸馏来提高模型的预测准确度。但在实际场景中外源数据难以获取,且在训练
学位
新型冠状病毒肺炎是一种严重危害世界人民健康甚至生命的疾病。对新冠的研究有多个方面,其中,患者在治疗过程中病情变化规律的研究,是一个重要的问题。根据患者治疗中的指标表现,可将其分为普通、重症、死亡3种程度,病情的变化规律指的是患病程度如何变化。根据临床实际治疗样本,总结了四种新冠患者病情变化规律:普通仍然普通、普通变成重症、重症变成普通、重症变成死亡。现阶段统计了上述四类患者的临床数据,包括病人肺部
学位
随着我国医疗科技的飞速发展,人们对医疗服务的需求和依赖也呈爆炸式增长,在这个过程中,不可避免地滋生出了许多治疗不规范、费用不合理的情况。为了能够提高医疗质量、控制医疗费用,临床路径与疾病诊断相关分组(Diagnosis Related Groups,DRG)作为一种有效的技术手段开始被广泛使用。但是其依然存在着数据容易被篡改、医疗异常无法及时被发现以及出现医疗事故后无法查询出详细信息和定责等问题。
学位
近年来,社群搜索已经广泛用于好友推荐、事件组织与活动举办和基于地理与社交的数据分析等基于位置的应用场景中,但是社群中包含大量的用户信息,如果对社群搜索进行不当的利用,用户的社交好友关系、签到行为喜好甚至其他隐私信息都会被泄露,采取措施保护用户的原始数据,消除社群搜索应用存在的隐私泄露隐患,对保证用户的安全具有重要意义。分析了仅对用户的社交关系或签到数据采取隐私保护后,社群搜索仍然存在的隐私泄露问题
学位
为了准确刻画网络论坛投资者情绪并探讨其与我国股市的收益关系,本文将根据东方财富网股吧数据,基于BERT模型构建投资者情绪指数,并借助向量自回归模型考察投资者情绪与股市收益率和成交量之间的动态影响。实证结果表明:相较于6种经典的情感分类模型,本文构建的BERT模型在各项评估指标上的表现更佳;股市收益率对投资者情绪存在正向影响,投资者情绪与成交量存在双向影响。
期刊
在计算机视觉领域,三维人脸重建是一个非常热门的研究方向。三维人脸重建方法的目标是根据已有的二维人脸图像,构建出真实且高精度的三维人脸。由三维人脸重建算法恢复的三维人脸可以应用于影视、动画和医学等领域。三维人脸重建技术可作为辅助技术用于人脸编辑和人脸识别等研究方向。现有的基于深度学习的三维人脸重建方法无法生成真实的人脸纹理和精确的人脸形状,对于多样性原始图像重建人脸的鲁棒性不够好。为了生成更加真实且
学位