面向草图检索的相关反馈技术研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:sssmickey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手绘草图既符合人们“笔录纸现”的思维表达习惯,又能充分利用计算机极强的信息维护功能,因此在人机交互领域具有强大的生命力。小型化、便携式和无线设备的快速发展极大地推动了手绘草图领域的发展。大量的蕴涵丰富信息的草图不断涌现,对这些信息的检索和利用也就成为一个新的研究课题。 本文将基于机器学习的相关反馈技术引入到草图检索中,尝试利用相关反馈技术来捕捉用户检索的主观意图,对相关反馈中线性规划分类器和相似度计算方法进行了全面的分析和研究,设计草图检索及相关反馈实验对本文中所述各项技术进行了全面的实验论证和分析。 论文的主要成果体现在以下几个方面: (1)提出手绘草图检索研究框架。 草图固有的模糊性和用户所表达的概念与计算机理解的草图特征之间的“语义鸿沟”是造成草图检索中用户检索意图无法准确捕获的原因。本文在详细分析了草图所固有的模糊性,在前期研究的基础上采用相关反馈技术尝试准确捕获用户检索意图,并据此给出了草图检索系统方案。 (2)将线性规划分类器引入到相关反馈中。 本文在详细介绍了线性规划发展的基础上,论述如何利用最小化样本集之间分类错误的思想构造线性规划分类器。线性规划分类器将样本分类过程与特征选择过程有机地结合在一起,在完成样本分类的同时进行特征选择,能够在小样本训练条件下具有良好的分类性能。实验在分析小样本条件下线性规划分类器的分类性能的基础上,验证线性规划分类器在相关反馈中的有效性。 (3)提出样本点距离和分类结果相结合的相似度计算方法。 在机器学习方法引入到相关反馈方法中,基于分类结果的相似度计算方法成为相似度计算的主流。基于分类器分类结果的相似度计算本质在于利用模式分类器来构建一个分类模型,并利用该分类模型将未归类的样本进行归类,最终利用分类器的分类结果(或类别可能性)来衡量未知样本点与用户输入查询样本点之间的相似度。然而,样本库中大量未标注的样本类别影响相似度计算的精度。本文将样本点距离和分类结果相结合,提出一种全局相似度计算方法。该方法利用分类器分类结果排除反例样本,并利用样本点距离来减弱分类器分类错误带来的影响,使得相似度计算过程高效而稳定。
其他文献
近年来,基于人体生物特征的身份识别技术越来越受到国内外学术界、企业界、政府以及国防军事部门的高度重视,并且产生了巨大的社会与经济效应。人体生物特征识别技术是指利用人
神经网络一直是模式识别领域中研究的热点。由于神经网络具有非常好的学习能力和泛化性能,以及其统一的结构、易于硬件实现和类似生物神经系统的工作实现机制等优点,神经网络已
随着计算机技术和普适计算技术的发展,情感的表达与感知作为人与人交互的辅助手段愈发突显其重要性。近年来,人们不再局限于计算机单纯的使用功能,更加希望挖掘计算机的更多
已有模型资源的有效重用是计算机图形领域面临的重要课题之一。本文以常见的室内景物作为研究对象,利用体感设备针对景物采集所得的RGBD数据的分割结果在三维模型库中检索相
随着计算机技术的飞速发展和广泛应用,海量信息的开放与共享日益增强,信息安全性日益成为突出问题。数据库系统作为信息存储的主要场所,保证和加强其安全性是迫切需要解决的研究
随着社会的进步和发展,人们不断涉及到很多复杂的实际应用问题。他们对计算机的计算速度和智能性提出了挑战。演化算法是用计算机模拟大自然的演化过程,特别是生物进化过程,来求
串匹配是计算机研究领域的一个经典问题,是许多网络安全系统的关键技术之一.随着信息量的急遽膨胀,应用系统要求更准确、更快速的对海量信息进行分析过滤,采用简单关键词来描
静校正在地震资料处理中十分重要。经野外一次静校正后,残余的静校正量可用剩余静校正方法求出。剩余静校正问题实质上是一个非线性优化问题。遗传算法是一种重要的非线性全
本文所研发的“基于GIS的多目标地球化学信息管理与综合评价系统”以国土资源部与上海合作开展的“多参数立体城市地质调查项目”为背景。 上海社会经济近十余年来发展速
随着WWW的迅速发展,Web信息检索技术成为研究者广泛关注的话题,但缺少合适的测试评测机制制约了中文网页信息检索技术的发展。参考国外测试集的构建经验,我们构建了大规模中文网