【摘 要】
:
三维物体语义理解和旋转不变性特征研究一直是解决许多实际应用的关键性问题。由于现实场景中三维模型所处方位往往不确定,语义分析算法在实际当中的应用面临诸多挑战。同时,语义定义的模糊性导致很难有一个定义的标准能够符合所有人的认知,因此现有的语义相关数据集以及算法存在一定的局限。但是人对于不同物体之间的语义对应关系存在一定的共识,利用对应关系可以一定程度上避免语义定义带来的歧义,从而可以从一个全新的角度促
论文部分内容阅读
三维物体语义理解和旋转不变性特征研究一直是解决许多实际应用的关键性问题。由于现实场景中三维模型所处方位往往不确定,语义分析算法在实际当中的应用面临诸多挑战。同时,语义定义的模糊性导致很难有一个定义的标准能够符合所有人的认知,因此现有的语义相关数据集以及算法存在一定的局限。但是人对于不同物体之间的语义对应关系存在一定的共识,利用对应关系可以一定程度上避免语义定义带来的歧义,从而可以从一个全新的角度促进三维物体语义理解。综合以上现阶段研究所面临的问题与挑战,在不确定旋转条件下的物体细粒度匹配研究任务具有一定的研究价值。本文旨在研究适应旋转变化的物体细粒度语义匹配算法的设计,并探索其在不同物体语义分析应用中的拓展。主要研究成果如下:1.针对三维物体在现实场景当中旋转角度不确定,研究在单位球形空间当中利用球形体素卷积来逐层提取旋转不变性特征,并利用点云重建模块将点云从球形信号当中重建出来,有效地保证了深度学习网络提取出逐点的旋转不变特征。2.针对三维物体细粒度语义匹配的问题,设计了测地距离一致损失函数指导的训练算法来促使深度神经网络能够根据物体对应关系数据集学习得到具有语义代表性的特征,同时不同点之间又具有足够的区分度,有效地找到了物体之间的细粒度语义对应关系。3.针对匹配任务需求,设计了平均测地距离误差评价指标来衡量三维模型匹配任务的性能优劣。最后还展示了算法提取得到的语义特征在不同三维语义分析任务上的应用。
其他文献
世界上有数百万的聋哑人,他们不能像常人一样通过语言进行沟通,而是通过手语进行沟通交流,这给生活带来了诸多不便。因此,开发一套可以让常人理解他们的手语实时识别系统是非常有意义且有价值的。在本文中,我们研究了一套中国手语实时识别系统,该系统可以识别聋哑人的中国手语,并实时地通过文字与语音的形式将识别结果输出给用户。首先,我们创建一个中国手语数据集。依照国家通用手语常用词汇表,使用RGB摄像头采集了日常
目前,精益生产是最热门的生产方法之一,许多飞机制造商在其生产系统中都采用了精益原理。与此同时,互联网技术也在航空业中广泛应用。本文提出了将精益和物联网这两种方法集成以用于提高航空企业的竞争力。在将此概念应用于企业实际生产前,有必要对过程进行模拟并分析结果。本文将使用离散事件仿真来验证这些技术的效果。由于ARENA软件非常适合此研究,因此本文应用其实现建模。最后,本文得出的结论是,应该以集成的方式使
随着智能物联网时代的到来,大量基于目标跟踪或定位的服务日益增多,尤其在一些特定的室内场景下,例如监狱看守、养老院老人监护、自动化仓库设备等封闭的室内环境,众多服务需求都依赖于精确的目标跟踪与定位。现有室内定位方案即使定位精度已经可以达到不错的分米级,但是在一些复杂场景中,其精度仍然不高。而近几年来,视觉目标跟踪发展迅速,图像跟踪精度高达像素级别,但可靠性较差。本文的研究工作即同时结合了视觉目标跟踪
在企业的日常经营过程中,运用全面预算管理能够有效地改善企业内部控制管理,扩大企业的经济效益。因此,作为一种科学完整的管理体系,全面预算管理在企业实践中已经得到广泛的认可。但是,由于全面预算管理在我国企业的实践时间还比较短,目前仍然存在比较多的困境,亟须加以完善。本文介绍了企业实施全面预算管理的现实意义,分析了全面预算管理在实践过程中面临的主要问题,并据此提出具有针对性的对策建议,以期促进企业战略目
随着制造业向数字化、智能化的转型升级,企业间的竞争日趋激烈。在这样的背景下,在产品生产的早期阶段进行快速准确的报价是必不可少的。在制造业转型升级的过程中,CAD模型已经成为了贯穿整个生产周期的信息载体,这些蕴含了丰富信息的CAD模型成为了可以利用的珍贵资源。针对这一背景,本文设计了一种以零件的中性格式(.stp)B-rep模型文件作为输入的报价系统,并利用python OCC作为几何内核完成了系统
随着时代的发展、大数据的普及,人类所掌握的数据量也日益增长,而数据结构作为计算机存储、组织数据的方式,也随着新时代的发展不断推陈出新,其中双向映射数据结构作为一类重要的数据结构,被广泛用于一类双向映射数据集的存储、检索应用场景,如数据重映射优化、DNS(Domain Name System)等应用场景。资源描述框架(RDF)作为新时代的数据模型,通常用于描述Web资源的特性、资源之间的关系,已经被
随着计算机视觉领域的快速发展,近年来,基于图片和视频的3D人体姿态估计吸引了越来越多人的注意。与2D人体骨架相比,3D人体骨架由于具有旋转不变性,在动作分类上可以取得更好的效果。因此,做好3D姿态估计将会极大的推动动作分类领域的发展。然而,据我们所知,大多数工作解决的是在控制环境下的单人3D姿态估计问题。因此,在自然条件下解决多人3D姿态估计问题有着重要的应用价值。我们提出了基于视频的多人3D姿态
随着近年来信息技术行业的快速发展,传统行业信息化已经被越来越多的企业列为企业的重要战略目标。第三方检验行业作为一个具有拥有悠久历史的行业,同样需要借助信息化手段,解决目前业务领域遇到的管理成本高,人员作业强度大,流程控制困难等问题。本文针对第三方检验机构的业务特点,设计并实现了一套基于微服务架构的检验报告系统,从目前的业务实践中所反映出的问题着手,分析并确立报告系统的功能性及非功能性需求。同时,对
近几年来,业界广泛使用Hadoop MapReduce、Spark等分布式并行计算框架进行大数据处理,这些框架大部分都遵从BSP模型,shuffle阶段在大数据处理中无法避免。随着处理的数据量爆炸性的增长,企业考量成本与容错性倾向于将shuffle阶段的中间数据储存于磁盘中,而不是内存中。因此,分布式计算任务的shuffle阶段中不仅有着密集的网络I/O,还有着密集的磁盘I/O。这两种密集的I/O
大面积农田具有交通不便、幅员广阔等监测难点,为农田建立时空模型能帮助管理者加强信息化、智能化生产管理。现有的时空建模方法多采用卫星遥感技术或定点高清摄像技术采集时空数据:卫星遥感技术以成本低、覆盖范围广的优势被广泛应用于土地覆被监控;定点高清摄像技术具有实时性强、分辨率高等特点,应用于小面积范围内的实时监控。但目前仍主要存在两大难题:其一,多源时空数据的异构性问题。遥感数据与定点摄影数据在成像条件