基于卷积神经网络的三维模型检索方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:luoxingrobin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于因特网和计算机软硬件技术的高速发展,以及三维建模技术的日渐成熟,相比于文本和二维图像,三维模型不仅更完整地包含了物体自身的信息,同时也体现了模型的空间信息,相邻物体间的相对距离,可以更加生动地展示与人眼更加贴合的三维世界。在此背景之下,三维模型的分类与检索具有重要的商业应用前景。早期的三维模型检索方法是以文本为基础,由于此方法太具有个人主观性难以应用到复杂多变的三维模型上,后来逐渐转变为基于内容的检索。这类方法通常由这两种方法实现:基于模型的检索和基于视图的检索。基于模型的检索直接从三维模型数据中提取特征再在数据库进行检索。但现有技术主要针对整体特征,对于局部检索的功能尚不完备,而且从异类物体检索对象的能力不足,最重要的是直接从三维模型获取特征,对于设备有严格要求。针对上述问题,我们选择基于视图的检索方式。本文重点研究基于卷积神经网络的三维模型检索方法,首先我们提出了一种基于多视点卷积神经网络分类模型。在分类模型中,我们使用多视角二维图片表征一个三维模型,每一个视图各自独立地通过第一个卷积神经网络,所有分支共享相同的卷积神经网络参数。每一个视角图产生一个特征,用View-pooling池化层聚合多视角二维图的特征生成一个简单且高效的三维形状描述子,作为第二个卷积神经网络的真实输入。通过PCA降维排出多余的噪声信息,使得特征更好地代表三维模型,同时提高检索效率。实验证明,课题中提出的方法能够取得较好的分类结果,在分类准确度(accuracy)和检索准确度(mAP)上分别达到91.00%和81.5%。除此方法之外,我们还提出了一种基于多层卷积神经网络进行三维形状检索的方法,具有更全面的信息,其中两个低分辨率路径添加到网络中,能捕获视觉外观并减少图像之间的不变性。实验证明,分类和检索性能进一步提升,在分类准确度(accuracy)和检索准确度(mAP)上分别提升了0.7%和0.6%。
其他文献
本文的研究内容依托于国家自然科学基金项目“LED光源光谱/色温对隧道各段照明的适用性研究”。在白天,当驾驶员驾车驶入隧道时,由于隧道内外照明环境的不同,会产生“黑洞效应”,并将出现短暂的失明现象,严重影响行车安全,尤其是隧道的入口段交通事故频发,因此,研究隧道入口段的暗适应很有必要。光源照明给人的直观感受是亮度和光色。本文研究的是白昼隧道入口段的暗适应。暗适应过程主要与两个因素有关,一个是暗适应开
搜索式无载体信息隐藏是新近提出的无载体信息隐藏方法的典型思路,该类方法通过检索大数据库来寻找自然无修改载体来表达秘密信息以对抗密写分析的检测。但这类方法存在的问
石油中存在着大量的含硫化合物,在燃烧过程中会生成硫氧化物对环境造成十分严重的影响。石油中存在的噻吩类物质一直是石油脱硫中较难去除的化合物。随着人们对环境保护的意识越来越强,对于石油中硫含量的限制也越来越高。而如何有效地去除噻吩类化合物是石油加工过程的一大难题。氧化脱硫是生产超清洁燃料的最具前景的技术,可以脱除加氢脱硫技术难以去除的苯并噻吩、二苯并噻吩及其衍生物等。而常规的氧化脱硫需使用催化剂来促进
目前,临床上用于骨缺损修复的生物材料主要包括不可降解的金属材料、可吸收的有机高分子材料和生物陶瓷材料等。其中钛合金等生物惰性材料需要二次手术取出,增加了患者的创伤和费用负担,而可降解生物材料力学性能差,无法满足承载部位的骨替换。近年来,生物可降解金属材料逐步发展,其特性能够弥补传统金属材料和可降解生物材料的局限,具有十分广阔的发展前景。本课题主要探索钙磷涂层多孔锌合金支架材料在颅颌面骨缺损修复中的
学位
近年来,人体动作识别已成为计算机视觉领域的重要研究方向,广泛应用于人机交互、视频监控、虚拟现实等领域,对于人工智能发展有重要的推动意义。动作识别在受限的实验环境条
姿控飞轮是轻型敏捷型军用卫星姿控系统的核心部件。近年来,采用低密度、高强度、高模量的碳纤维复合材料进一步改善飞轮的转动惯量-质量比等性能已成为主要趋势。国内卫星姿
随着中国旅游业的快速发展以及国际声望的日益提高,近年来到中国旅游的外国游客越来越多,根据世界旅游组织的评估,中国将在2020年发展成为世界排名第一的旅游目的地国家。入
在人们的生活中存在大量的不平衡数据。研究表明,传统以最大化分类准确率为目标的机器学习算法倾向于将待测试样本划分为多类,而忽视少类的识别率。然而,通常少类样本具有重
天然气储量丰富、容易形成预混合气、颗粒物排放少且抗爆性好的特点使其适合作为汽车代用燃料。由于天然气层流火焰传播速度慢,导致天然气发动机燃烧持续期长,后燃严重,甚至