深度学习中三维几何数据的表示及其网络设计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liuwu123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
决定三维几何数据的表示形式作为几何学习的第一步,对后续神经网络架构的搭建以及学习效率有着至关重要的影响。从深度学习的角度来看,三维几何可以根据同种数据间是否共享相同的拓扑归为两类。在本文中,我们对具体任务中这两种类型的几何数据的表示和网络设计展开研究。三维人体骨架是典型的具有一致拓扑的几何数据。为了从单张RGB图像中重建三维人体姿态,本文提出了一种结构感知的、对遮挡鲁棒的三维姿态表示方法,称为骨骼图(Bone Maps)。骨骼图表示法适用于具有更少参数量、计算量更低的全卷积网络,可以提高时间性能。此外,我们利用骨架结构定义超骨骼图以引入人体姿态的全局信息,使得网络在遮挡出现时更好地对缺失的关节点位置进行推理。最后,骨骼图针对一张输入图像给出多个三维姿态候选,可以帮助网络更好地处理这个从二维到三维的病态学习任务。实验表明,本文方法在保证优越时间性能的同时,姿态估计的精度与当前最高水平的工作可比。复杂的几何数据通常由两种类型的信息组成。譬如,三维牙齿点云通常具有固定数量的牙齿和已知的牙齿间连接关系,但每颗牙齿又是由不具有一致拓扑的点集组成。在正畸治疗计划中,一副牙齿模型中每颗牙齿的六个自由度的位姿、几何细节以及它们之间的相互关系对于判断当前牙齿布局是否符合美学性和功能性等要求具有重要作用。在这样一个任务中,本文使用基于图(graph)的表示来表达牙齿模型一致的拓扑结构,使用点云网络编码的特征来表示每颗牙齿点云的几何形状。通过结合这两种表示方法,本文提出了一个基于图神经网络的特征传播模块和一系列相关的损失函数,以增强牙齿间形状和位置信息的沟通,并产生紧凑的牙齿排列。本文方法是第一个基于学习的自动排牙算法。量化实验和用户调研结果表明,本文方法可以得到与专业医生推荐的治疗方案相似的结果。捕获三维物体表面形状细节的几何数据一般不具有一致的拓扑。为了更好地表示连续的三维表面形状,本文提出一种晶格对齐的隐式神经表示方法,在不需要对三维形状进行分割的情况下得到三维形状的局部表示。基于这种表示,我们提出了基于三维卷积网络的自解码器,避免了对输入数据进行体素化或池化,从而减少了信息损失。定量和定性的比较实验表明,本文方法的重建精度相比于现有方法得到了较高的提升。另外,提出的局部化表示方法具有较好的可编辑性,我们展示了部分形状抹除、部分形状拼接以及整体形状翻译三种形状编辑方式。其中,所提出的三维形状翻译网络在只给两个三维形状集合而没有其它任何标注的情况下,以无监督的方式学习两个不同类别的物体之间的相互变换。结果表明,基于提出的局部隐式表示方法的形状翻译网络可以生成具有连续表面的三维模型,并且相比现有方法能生成具有更多模态的结果,对输入形状的特征保持也更加稳定。
其他文献
激光诱导前向转移技术(Laser induced forward transfer,LIFT)是一种高精度的数字化定向转移技术,能适用于多种不同相态的材料。根据材料种类的不同,会发生不同的转移模式。本文以非牛顿体浆料作为靶材,研究了激光诱导非牛顿体浆料点转印、线转印技术中的转移机理以及参数对转印结果的影响规律。根据研究结论,优化了工艺参数、改良了工艺步骤。实现了点阵锡膏、银浆栅线的高精度印刷。本论
学位
视频分析技术中视频行为识别是指识别视频所表达的行为,而视频行为空时检测是指检测行为在视频中的空间和时间位置。视频行为识别和行为检测技术在视频监控、医疗监控、运动训练、人机交互、视频搜索等诸多领域有广泛的应用前景和经济价值。由于视频行为空间信息与运动信息的提取机制不一致性、目标多尺度性、背景复杂、目标遮挡、成像分辨率不一致、模糊、目标不规则移动等不利因素影响,视频行为识别与空时检测是一个非常具有挑战
学位
近年来,猪流行性腹泻病毒(PEDV)感染是导致我国仔猪腹泻和死亡的主要原因之一,给养殖场带来严重经济损失。疫苗接种曾是预防PEDV感染的有效方法,但由于病毒变异较快,易导致疫苗针对性不强,目前也仍缺乏有效的预防和治疗手段。因此,寻求可能的营养调控措施提高仔猪免疫力,抑制病毒复制,缓解仔猪感染变得尤为迫切。维生素D(VD)是近年来备受关注、具有免疫调节和抵抗病原微生物感染作用的一种脂溶性维生素。VD
学位
未来的无线通信需要提供无处不在的网络覆盖、越来越多元化的网络服务,这都需要高传输速率的支持,因此在频谱资源日益匮乏的情况下,怎么提高频谱效率是无线通信系统面临的首要难题。同时随着网络用户和设备的持续增加,能源消耗也日益增加,怎么提高能量效率,实现可持续发展也是通信系统设计需要考虑的另外一个重要问题。全双工分布式天线系统(Distributed Antenna System,DAS)是全双工技术和D
学位
准确合理地避让交通环境中的各类障碍物是自动驾驶系统的关键功能。随着自动驾驶系统的逐步实用化,避障轨迹规划功能面临多方面需求,不但要满足不同场景的避障要求,还应考虑避障行为的类人性和车辆轨迹的基本需求。针对现有方法对上述需求覆盖不充分、处理不协调的问题,提出基于多属性几何结构功能的综合避障轨迹规划方法,主要工作如下:1)分析避障轨迹规划问题需求,确定问题的基本求解模式。归纳避障问题关键技术需求,构建
学位
为了推动建筑工业化发展,拓宽装配式技术的应用,本文以梁端铰接钢管混凝土框架-钢筋混凝土筒体结构体系为研究对象,将外框架钢梁与柱、核心筒的节点修改为螺栓连接的铰接节点,使得新的高层结构体系成为半装配式的新型抗侧力结构体系,降低了外框架设计难度和提高了经济效益。目前对这种新型结构体系的研究还比较少,针对此新型结构的抗震性能进行研究,在地震模拟振动台试验研究的基础上,建立可靠的非线性有限元模型,分析常用
学位
下料和装箱问题是一类具有NP-hard复杂度的优化问题,可以被规约为背包问题。此类问题可以使用线性整数规划模型描述。由于数学模型中存在大量决策变量,使用精确算法求解问题模型一般不太可能在现实应用条件下得到最优解,甚至很难求得可接受的较好解。当将原模型简化为普通非整数线性规划模型,由于涉及到生成多维度几何布局的工作,上述问题仍然存在。相对来说启发式算法更容易实现,在较短计算时间内也更可能得到较好的解
学位
高熵合金(high entropy alloy,HEA)是一类含有至少四种组元,且各组元原子质量比在5-35%之间的新型合金。凝固时形成单相固溶体或多相固溶体而不是复杂的金属间化合物。这种特殊的固溶体结构,使高熵合金具有高强度、高硬度、优良的疲劳性能、耐磨性和耐蚀性等优点,是一种极具发展潜力的新型金属材料。目前,高熵合金主要制备方法是铸造法。然而,此类技术制备的合金形状简单、尺寸大小受限,普遍存在
学位
1980年代,中国当代建筑理论研究复苏,中国特色建筑发展道路的探索重新起航。经历了40余年的高速发展,中国的文化建设和建筑实践取得了举世瞩目的成就,建构自主的中国建筑思想与理论体系、展现中国文化价值观念,一直是时代必然的需求。在此过程中,不乏许多建筑学人的努力,将理论研究与实践结合起来,提出建筑创作理念与思想,向世界提供“中国经验”,显现了当代中国文化的智慧。时至今日,在中国知识体系建构要求日益迫
学位
目前主流的生物神经计算以霍奇金和赫胥黎在1952年提出的电学模型为基础,其核心是由离子通道控制的离子被动跨膜转运电流.他们把细胞膜和离子通道当做电学元件处理,这一观点也被后来的电生理研究继承.然而,关于离子通道进化历史的研究表明,一些神经元离子通道的出现早于神经元.由此可见,要想深化我们对神经元活动的理解,就必须建立适用于其他多种细胞的离子通道模型.近几十年来,随着电生理实验的范围的扩大,从神经到
学位