基于单视图和深度学习的古文物三维重建技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:chenpeng12333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古文物承载着人类文明千年以来的历史文化和精神内涵,对研究古代经济、文明等方面起到至关重要的作用。通过将古文物进行数字化处理,从二维图像转换为三维模型的形式能够有效地减少实体展览所带来的空间和时间上的资源损耗,同时能够使人们能够通过网络的形式以三维的角度更全面地去了解并学习古代文物所蕴含的历史文化。不同于传统的三维重建方式,基于深度学习的三维重建方式更适用于单视图的情况,同时能够在不需要复杂的图像处理操作前提下进行三维重建。因此,研究单视图和深度学习的古文物三维重建技术具有深远意义。本文的具体研究内容如下:针对目前特征提取算法提取能力不足的问题,利用现有的高阶信息提取算法,提出了一种2D-高阶模块。在现有的文物以及工艺品数据集基础上,编码器层面上通过1×1卷积和算子求积求和的方式实现2D-高阶模块。使用该模块能够挖掘出图像数据的深度信息,对图片中复杂的高阶关系进行建模,提高了特征提取的性能效果,解决了一阶特征提取中存在的图片信息提取深度不够、粗糙且特征不明显的问题。使用2D-高阶模块结合Res Net的方式作为编码器的Io U指标为0.570,对比仅使用Res Net作为编码器的3D-R2N2提高了1.2%。针对现有重建算法精度不够的问题,使用“编码器-解码器-优化器”作为整体网络结构,提出了2D-Rep VGG(2D-Re Parameterization Visual Geometry Group)网络模型作为编码器,该模型以单分支的形式对多分支参数进行模拟,在精度和性能上较于残差网络均有更好的效果。使用了AM-Softmax作为损失函数,并以上下文感知融合模块作为优化器,将体素模型的细节部分进行优化。实验结果表明,整体的网络模型对比Pix Vox的Io U值提高了0.7%。根据上述的研究内容,本研究设计并实现了基于单视图和三维重建的古文物三维重建系统。该系统能够实现图片上传、三维重建、数据下载功能。对于用户输入的图片数据,该系统能够对图片进行自动检测,在符合输入条件的情况下生成对应的三维体素模型。实验证明系统整体高效可用,各项功能均能正确执行。
其他文献
科技发展推动着人类社会的进步,而计算机的产生极大程度地便利了人们的生活。物联网设备从最初的工业使用,截止目前已经走进普通大众的家庭,例如,智能手机、智能家居等等。当越来越多的物联网设备被连接到远程计算机时,一些别有用心之人就想通过截取物联网设备的信息并从中牟取暴利,所以其安全问题也引起了越来越多的学者关注。跨平台病毒是一种在物联网设备和计算机之间传播的网络病毒。近代以来,跨平台病毒不断发展,版本更
学位
近年来,随着互联网高速发展,越来越多的产业加入到了信息化群体中,如电子商业、电子阅读、音乐播放、新闻媒体等,而这些产业早已融入到人们的日常生活和娱乐中。人们在享受互联网带来便利的同时,大多都习惯留下自己对产品和服务的评论或意见。例如,酒店的评价包含了大量的用户反馈信息,而这些信息具有较大的研究价值。所以,如何从大量的评论中快速提取出情感信息,并对不同情感极性的评论进行分类,已成为大部分互联网服务面
学位
期刊
多目标追踪是计算机视觉领域的热点问题,被广泛应用于智慧交通、智能监控、自动驾驶等领域。随着体育产业的快速发展,体育运动中的运动员追踪问题逐渐受到关注。不同于普通监控场景中的行人追踪,体育运动场景中运动员频繁遮挡、姿态变化大、外观相似等问题给运动员追踪带来很大的挑战。本文以篮球运动员追踪为研究对象,针对运动员检测、追踪方法进行研究。本文的主要内容如下:1.针对篮球运动场景下目标漏检问题,本文提出了一
学位
随着大数据、人工智能等技术的迅速发展及普遍应用,数据的规模呈现快速增长的趋势,大量的数据需要被实时处理。Apache Flink作为新生代的流式数据处理框架,相比于Storm、Spark等框架拥有更高的吞吐量和更低的延迟,为流式数据的实时处理提供了新的选择。然而,Flink默认采用随机的方式将任务分配给节点,在当前流行将大数据服务部署到云平台的场景下,没有考虑到在集群中可能造成的成本浪费以及负载不
学位
传统密码学的安全性主要依赖数学困难问题,该问题在经典世界中难以被解决。随着量子计算机的出现,传统密码学的安全性岌岌可危,为了解决此问题,量子密码学应运而生。量子密码学依靠量子力学基本特性,使得它在理论上能达到无条件安全。鉴于此,学者们提出了许多量子密码领域的协议,量子密码学成为量子信息中的重要分支。量子隐私查询是量子密码学中的重要研究内容,也是经典隐私查询在量子领域的延伸。虽然学者们提出了许多基于
学位
同时具有高时间分辨率和高空间分辨率的遥感图像对于监测地表异质景观至关重要。然而,由于卫星传感器硬件技术以及发射预算等因素的限制,获取具有高时空分辨率的遥感图像并不容易。这使得国内外的研究学者将目光集中到对现有卫星观测数据进行后处理,从而获取所需的高时空分辨率数据。在深度神经网络中,相对于图像的一些基本属性:颜色、纹理、形状等特征,深层特征即通过设计网络模型来挖掘图像更为抽象、更高级的特征。在时空融
学位
车云计算是云计算技术在车载网上的扩展,旨在利用车辆闲置的计算、存储等资源构建成云为车辆提供实时服务,保证车辆决策的实时性和有效性,实现智能交通管理,提升交通效率及安全性。然而车云具有高度的动态性和自组织性,如何安全匿名且高效地构建车云以及保证云用户的隐私是一个挑战。目前已有的研究方案中存在车辆的隐私保护问题或是构建车云的方案效率不高。本文重点研究在保护车辆身份隐私及位置隐私的情况下高效地构建车云,
学位
随着数据量的爆炸式增长,数据中蕴含的知识信息也越来越复杂多元化。因此,如何从海量数据信息中有效地挖掘出知识成为了当今学者研究的一大热点问题。知识发现一直都是大数据技术下的一个主要研究点之一,基于概率粗糙集的三支决策就是一种典型的知识发现算法,一个作为解决复杂问题和不确定性问题的三分而治模型,并且结合多粒度思想构建的序贯三支决策模型,能很好地实现复杂问题的动态决策的效果。然而,在实际决策中,当没有决
学位
随着云原生时代的到来,Kubernetes和容器技术已经成为云计算领域的主流技术。Kubernetes因其实现了对容器的服务发现与调度、负载均衡、服务自愈、弹性扩缩容和存储卷等功能,被作为容器管理平台的首选。虽然Kubernetes具备丰富的容器管理功能,但是它并不会考虑容器运行过程中的成本问题以及整体Pod之间的关系,也不具备重调度机制来节省成本。为此,本论文提出了基于Kubernetes的成本
学位