跨域三维模型检索方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:xtljj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维模型技术随着信息技术的迅猛发张取得了广泛的应用,三维模型存在于人们生活的方方面面,例如三维建模、三维重建、3D电影、三维体感游戏和三维医疗等。特别地,得益于已经在各行各业逐渐普及的三维模型拍摄设备,每天都有海量的三维模型被分享到网络平台,相应的产生了大量三维模型数据集。然而,其中只有小部分用于学术研究的数据集具有详细和相对准确的人工标注,大部分三维模型数据库,尤其是用户端三维拍摄设备获取的三维数据都缺少类别和属性标签信息,这为三维模型大数据的智能管理带来极大挑战,也为三维模型检索关键技术研究带来新问题,例如如何利用有标签的三维模型预测无标签三维模型的类别信息,如何实现来自不同数据库的三维模型互相检索。因此,跨域三维模型检索成为了该领域一项具有重要理论研究意义和应用价值的研究问题。具体研究工作包括一下两个方面:
  (1)针对三维模型检索问题,本文提出了联合几何分布和统计分布的跨域三维模型检索方法。该方法在检索过程中不要求目标域数据具有标签信息,因此该方法属于无监督学习。该方法可以有效整合三维模型的深度特征学习和域自适应学习。通过保留每个域的共有特征和特定特征,使两个数据域之间的统计偏移和几何偏移以无监督的方式最小化。同时,域自适应学习可以增加三维模型特征的判别性信息,有助于提升跨域检索性能。
  (2)对于大规模数据库,模型数量更多,场景更加复杂。因此,本文还提出了联合域对齐的端到端的跨域三维模型检索网络(End-to-End Visual Domain Adaptation Network for Cross-Domain 3D CPS Data Retrieval, C3DOR-Net),相较于VDA,该方法把域适应方法用损失函数实现,成为了端到端的跨域检索方法,联合学习避免了多阶段方法造成的误差累积,性能更好。
  本文根据三维模型数据格式和模态的差异在三组跨域三维模型检索数据集上进行实验:1)PSB(Princeton Shape Benchmark)和NTU(National Taiwan University’s Dataset)两个数据集的CAD模型互相检索;2)从包含CAD和RGB-D三维模型的ObjectNN数据集中实现RGB-D到CAD的检索;3)基于二维图像的三维模型检索。在与相关领域最流行的算法做比较之后,大量实验都证明了本文提出方法的优越性。
其他文献
大数据与深度学习的发展极大促进了图像分类技术的进步。由于深度学习的数据驱动和监督式学习特性,在训练阶段需要大规模标注样本。然而,现实世界包含数以万计的类别,人工标注需要极高人力物力,且对于某些稀缺类别,往往难以获取充足样本支撑训练。为此,无需标注样本即可对新类别进行预测的零样本学习(Zero-shot Learning,ZSL)逐渐受到关注。零样本学习模仿人类可利用辅助语义信息对未见事物进行推断的
学位
水声多载波通信技术是当今水下通信中应用最为广泛的一种技术,具有传输速率高、鲁棒性好以及传播距离远等优点。但是,水声通信信道具有带宽受限、多径效应严重、多普勒效应严重等特点,多载波通信在水声通信方面依然面临着许多挑战。其中严重的多普勒效应对多载波通信影响巨大。  本文设计了一种新型的多载波调制方式,提升系统传输效率,并添加合适的多普勒估计补偿技术,用于水声通信系统中,提升多载波通信系统的传输性能。本
学位
随着互联网规模的爆炸式增长,雾计算、人工智能等创新技术的不断发展,互联网加速了由“通信信道”向“数据处理平台”的角色转变。在此情况下,一种以网内缓存为特色、面向通信内容的新型互联网架构——命名数据网,于2010年被提出并迅速得到国内外学术界的广泛关注。然而,命名数据网各领域的研究尚有大量技术瓶颈需要解决,特别是其内容路由器转发平面,仍然面临着诸如快速检索差异化名称数据、高效存储转发信息、有效支持名
随着信息技术的飞速发展,电子信息技术在如今的战争局势也发挥着越来越重要的作用。在电子对抗领域,对非合作目标源的定位问题一直是国内外学者广泛研究的热点。区别于雷达等对辐射源发射信号并接收回波的有源探测方式,无源定位是通过检测和估计辐射源的电磁波参数来确定辐射源位置。由于多站联合定位的方式效率低下并且风险较大,因此本文对实际应用更为灵活的单站无源定位展开研究。  本文主要对无源感知问题中的目标定位模型
学位
特征选择是维数约简的一种重要手段,其通过保留有效特征,消除无关和冗余特征,从原始特征集中选择一部分特征构成特征子集,从而达到数据降维的目的。然而,现有的一些特征选择算法难以保证在选择过程中同时考虑特征的相关性、冗余性和交互性三方面性质,导致算法的特征选择性能有限。此外,随着深度学习技术的发展,卷积神经网络在各个领域的应用越来越广泛,其常被用于提取图像特征,但大多数特征选择算法针对的都是传统的数据集
随着科学技术的不断发展和提高,立体显示技术被越来越广泛地应用在人们生活工作的各个领域。但是由于当前立体显示技术大多基于立体视差原理,视差所引起的辐辏调节冲突会引起观看立体影像时出现视觉不舒适的现象,降低了观看体验。因此,对于辐辏调节冲突对立体影像视觉舒适度影响的认知研究具有十分重要的意义。  本文首先采用脑电技术对单一视差所引发的视觉舒适度进行研究,提取了视差引起的舒适与否两类脑电信号的特征。将客
机器人技术涵盖众多的学科,包括机械制造、传感器应用和识别、电子技术、自动化与人工智能等。近些年,自动化技术和人工智能技术的不断发展大大推动了机器人技术的进步。根据应用场景不同,可将机器人分为工业机器人、农业机器人、家用机器人、医用机器人等。随着机器人的发展和大范围应用,对机器人智能化的要求越来越高,其中自主导航水平是评价一台机器人智能化的关键指标,而路径规划是机器人导航的重要组成部分。  路径规划
学位
光学乐谱识别作为乐谱内容符号化的关键技术,有助于音乐文件的存储与编辑,在音乐信息检索和计算机辅助教学等领域还有着重要应用价值。基于通用框架的光学乐谱识别算法存在处理步骤较复杂、精度较低等问题,而基于深度学习的算法虽有效地简化了通用框架,但其识别精度有待进一步提升,对于难点音符的识别误差较大,模型训练耗时久。为此本文提出一种改进的卷积循环神经网络光学乐谱识别方法。  本文中提出的光学乐谱识别算法主要
随着科学技术的日新月异及生活方式的改变,人们对位置信息的要求越来越高。在室内环境中,由于建筑物的阻挡等因素,全球导航卫星系统(Global Navigation Satellite System,GNSS)信号会发生衰减,GNSS难以满足人们对室内定位的需求。因此,众多室内定位解决方案层出不穷,其中基于行人航位推算(Pedestrian Dead Reckoning,PDR)理论的室内定位与跟踪技
火灾是人们日常生活中一种频繁发生且危害巨大的灾害事故。随着城市建筑向越来越高和越来越密集的趋势发展,火灾一旦发生,将严重威胁人们的生命财产安全。准确及时地检测到火灾发生对于防火救火具有十分重要的意义。传统的火灾检测技术多基于烟雾、光、热等多种火灾参数传感器来探测火灾,然而其受探测距离、安装位置等多种因素限制,报警速度慢、准确率低。进入21世纪以来,人类社会迈入高度的信息化时代,基于图像型的火灾检测
学位