【摘 要】
:
三维模型的数量日渐增多,然而手动标注三维模型需要占用额外的人力资源,效率较低。基于人工设计特征的三维模型识别精度较低。虽然卷积网络在图像分类和目标检测等各种视觉应
论文部分内容阅读
三维模型的数量日渐增多,然而手动标注三维模型需要占用额外的人力资源,效率较低。基于人工设计特征的三维模型识别精度较低。虽然卷积网络在图像分类和目标检测等各种视觉应用中有良好的表现,但大量池化层的引入会导致特征空间信息丢失。而胶囊网络(Capsnet)通过向量神经元保存特征的空间属性,对模型的变化具有更好的鲁棒性,因此可将胶囊网络应用于三维模型识别中来学习三维模型的特征信息。本文主要研究内容如下:(1)在三维模型识别任务中,针对池化层数量过多导致特征空间信息丢失的问题,依据胶囊网络的特性,提出了一种用以识别三维模型的3DSPNCapsNet(3D Small Pooling No dense Capsule Networks)网络模型。首先,将三维模型体素化为可以输入网络的数据类型;其次,使用新的网络结构提取更具代表性的特征;最后,提出基于动态路由算法(dynamic routing algorithm,DR)的DRL(dynamic routing-based algorithmwith length information)算法,优化胶囊权重的迭代计算过程。在Model Net10上进行实验,相比3DCapsNet以及Voxnet,该方法取得了更好的识别效果,在原始测试集的平均识别准确率达到95%。(2)在对三维模型的旋转识别任务中,为了验证胶囊网络对特征的空间位置角度变换的识别能力,首先对三维模型先旋转,再体素化,来扩充不同旋转角度的训练集,增加网络学习的旋转信息,同时对测试集也进行旋转扩充;其次,对各个角度体素化旋转模型进行可视化,证明旋转的有效性;最后,使用几个算法在不同旋转角度的旋转训练集上训练,在所有旋转角度的旋转测试集上测试。实验结果表明3DSPNCapsNet对未旋转模型的识别率达到96%,其他各角度旋转模型的平均识别率分别达到81%,对三维模型及其旋转具有良好的识别能力。
其他文献
近年来,以人脸识别、语音识别和图像处理等为代表的人工智能技术为智能化的教育发展带来了新的变革,当前这些技术被广泛应用教育领域。对于学生来说,课堂是最重要的学习场所
随着国民经济的日益发展,安全性的发展变成了一个越来越重要的话题,以危化品仓储为代表的高危环境的安全对社会经济人民安全的影响越来越大。能够对这种危化环境实现全方位实
人工选择进程极大提高了全球范围内小麦的产量。小麦选育和种植的最终目的就是优化群体产量,而通过单株株型进行高产品种的筛选(即系谱法)已成为小麦选育的主要手段,这需要育
近些年,“人工智能”也变成大众耳熟能详的名词,机器翻译、文本摘要等序列任务也得到广泛的应用。如今,在工业界以及学术界解决序列到序列问题的主流方法是采用序列到序列的
目的检测MAGE-A1、A2、A3在口腔黏膜异常增生中的去甲基化情况,分析三者去甲基化状态与口腔黏膜异常增生临床病理特征之间的关系,并进一步分析三者去甲基化状态与病理分级之间的相关性,为选择MAGE-A1A3作为口腔黏膜潜在恶变的标志物提供新的论据,也为口腔黏膜异常增生精准治疗提供新思路与新方法。方法收集20162018年内蒙古医科大附属医院口腔黏膜科与口腔颌面外科门诊病例53例,术后病理诊断明确
随着人口老龄化的加剧及人类日常生活便捷性需求的加深,在机场、商场等场合引入移动机器人减轻物力及人力成本显得愈发迫切。本文主要研究干扰场景下移动机器人对人体目标的
三支决策模型是由Yao Yiyu教授在粗糙集理论中引入贝叶斯风险决策概念和条件概率公式,对决策行为进行分析和归纳的一种代价敏感的决策学习方法。三支决策模型具有接受决策、
视觉目标跟踪能够解决目标的运动轨迹定位问题,现在已经广泛应用到智能安防,智慧交通,无人驾驶和生物医学等领域。大量尖端人才的涌现和多方资金的注入促进了视觉目标跟踪技
随着光纤通信技术的快速发展,LiNbO3电光调制器凭借自身低电压、低插损、高带宽以及复杂环境下稳定的工作性能,获得广泛应用。然而,LiNbO3电光调制器随着外加电场的漂移、复
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)以其传输速率快、频谱利用率高、功耗低等优势引发了业界的高度关注。然而该技术仍然存在一些未能解决的技术难题,