论文部分内容阅读
手绘草图既符合人们“笔录纸现”的思维表达习惯,又能充分利用计算机极强的信息维护功能,因此在人机交互领域具有强大的生命力。小型化、便携式和无线设备的快速发展极大地推动了手绘草图领域的发展。大量的蕴涵丰富信息的草图不断涌现,对这些信息的检索和利用也就成为一个新的研究课题。
本文将基于机器学习的相关反馈技术引入到草图检索中,尝试利用相关反馈技术来捕捉用户检索的主观意图,对相关反馈中线性规划分类器和相似度计算方法进行了全面的分析和研究,设计草图检索及相关反馈实验对本文中所述各项技术进行了全面的实验论证和分析。
论文的主要成果体现在以下几个方面:
(1)提出手绘草图检索研究框架。
草图固有的模糊性和用户所表达的概念与计算机理解的草图特征之间的“语义鸿沟”是造成草图检索中用户检索意图无法准确捕获的原因。本文在详细分析了草图所固有的模糊性,在前期研究的基础上采用相关反馈技术尝试准确捕获用户检索意图,并据此给出了草图检索系统方案。
(2)将线性规划分类器引入到相关反馈中。
本文在详细介绍了线性规划发展的基础上,论述如何利用最小化样本集之间分类错误的思想构造线性规划分类器。线性规划分类器将样本分类过程与特征选择过程有机地结合在一起,在完成样本分类的同时进行特征选择,能够在小样本训练条件下具有良好的分类性能。实验在分析小样本条件下线性规划分类器的分类性能的基础上,验证线性规划分类器在相关反馈中的有效性。
(3)提出样本点距离和分类结果相结合的相似度计算方法。
在机器学习方法引入到相关反馈方法中,基于分类结果的相似度计算方法成为相似度计算的主流。基于分类器分类结果的相似度计算本质在于利用模式分类器来构建一个分类模型,并利用该分类模型将未归类的样本进行归类,最终利用分类器的分类结果(或类别可能性)来衡量未知样本点与用户输入查询样本点之间的相似度。然而,样本库中大量未标注的样本类别影响相似度计算的精度。本文将样本点距离和分类结果相结合,提出一种全局相似度计算方法。该方法利用分类器分类结果排除反例样本,并利用样本点距离来减弱分类器分类错误带来的影响,使得相似度计算过程高效而稳定。