论文部分内容阅读
随着三维数据获取技术、三维图形建模方法以及计算机硬件技术的发展,三维模型数量快速增长,应用领域同益广泛,三维模型检索的需求不断涌现,成为多媒体信息检索领域的研究热点。为了提高三维模型检索系统的准确率,研究焦点已从设计复杂的低层特征提取方法转到如何使用语义,减少几何特征和人类语义丰富性之间的“语义鸿沟”。本文就此展开研究,主要贡献及具体工作如下:
(1)对基于语义的三维模型检索最新技术成果进行了综述,覆盖了主要的一些文献,包括低层特征提取、相似度测量和高层语义检索方法等。把基于语义的三维模型检索分为四大类:引入相关反馈到检索循环中,根据用户的意图进行在线连续学习;使用机器学习方法来建立低层特征和查询概念之间的联系;使用三维物体本体来定义高层概念;综合两种以上的方法。对这四类方法的特点进行了总结。对检索性能评价指标进行了分析。指出了三维模型语义检索下一步的研究重点和发展方向。
(2)提出了两种低层形状特征:统计两个采样点相对质心向量夹角的AC2直方图新特征与形状分布的D2特征组合而成的低层特征;将视图的二维Zernike矩与视图面积比例组合成的新特征ZA。AC2特征对模型的平移、旋转、尺度不变。实验证明了两种低层特征有较好鲁棒性和检索性能。提取的这些低层特征构成了语义学习的输入空间。针对集成多种形状特征、不同的相似度测量用于三维模型检索,提出自适应双阈值的多层次三维模型检索结构。采用双阈值多层次检索结构比单特征的检索准确率要高,并且与固定平均权重和规则的混合特征相比,在提高检索准确率的同时,也能保证检索效率。
(3)使用高斯过程进行三维模型语义分类的监督学习,计算测试模型的语义类概率预测分布,建立低层特征和查询概念之间的联系;使用语义距离和不相似度计算方法进行检索排序。实验结果表明,与支持向量机、神经网络等监督学习的方法相比,多类的测试模型进行语义分类的准确率得到提升,检索中能体现语义概念,性能也得到提高。
(4)进行三维模型语义分类的监督学习时,将单一的高斯核函数改进为由局部核和全局核组成的混合核函数。实验结果表明,高斯过程采用混合核函数,语义分类的准确率进一步得到提升,也取得了更好的检索效果。并且高斯过程的分类性能要优于采用相同混合核函数的支持向量机方法。
(5)为了解决三维模型语义检索中用户检索意图不一致和语义理解差异问题,建立了多粒度语义检索框架,使学习模型能够有效地适应用户的不同检索意图和不同语义理解。对模型分类知识进行层次划分,形成语义概念的多粒度结构。然后对多视图特征采用高斯过程建立不同粒度层次上的学习模型,实现低层特征和查询概念之间的语义一致性描述。和已有研究相比较,多粒度语义检索框架使用户可以通过语义粒度级别变化进行检索意图设置和语义理解表达,从而检索结果尽可能地符合用户语义。
根据上述研究工作,开发了一套具有初步实用价值的三维模型语义检索系统。