基于查询拓展和聚类技术的资源检索系统的研究与应用

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:windFWF1992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展和Web资源的丰富,利用Web全文信息检索系统来获取所需信息己经成为人们日常生活的重要组成部分,用户也越来越关注如何能够更加准确、高效地查找信息。为了提高Web信息检索的准确率,对资源所显现的语义与结构进行分析,本文分析了中文分词方法的特点,采用一元、二元、词表分词索引相结合的方法,为提高后续检索效率提供有价值的帮助。为了提高用户查询需求的有效性,提出对查询条件进行概念扩展,采用了多种查询策略相结合的方式,对此进行深入的研究,对提高Web信息检索的查全率和查准率是有效而且必要的。用户进行Web信息检索的查询请求一旦过于宽泛、模糊甚至不够准确,得到的结果数目将会相当巨大,用户因时间所限不可能查看每一个结果。因此,通过相关研究,对概念检出的文档进行上下文聚类,采用STC对聚类进行有效的描述,利用检索上下文中的分类描述进行潜在概念的获取,通过SVD技术对构建的矩阵进行特征降维和聚类,实现了资源检索的实时聚类,将检索结果形成类别呈现出来,作为一种自动的、即时动态交互,能极大地提高用户检索效率,同时有益于帮助用户形成更为清晰的查询,对于以用户为中心的Web信息检索有很大的价值。本文最后介绍了上海教育资源库信息检索系统的设计和实现架构,主要组成模块的相关技术,对多种检索策略进行了多样本的查询对比和分析,实验证明检索算法提高了信息检索的针对性和聚焦度,且在此结果上的在线聚类能较好地改善信息检索结果的展现。
其他文献
当今互联网搜索引擎主要分为通用搜索引擎和面向领域的搜索引擎(也称为垂直搜索引擎),而后者又成为搜索引擎技术发展的一大趋势。因为在某些用户有特定要求的领域,通用搜索引
随着网络信息化的高速发展,网络中的可用Web服务资源日渐增多,通过Web服务集成可以充分利用已有资源,实现面向网络化、跨地域和异构平台的系统功能的一体化。但是,Web服务无法高
随着社会的不断进步和网络技术的不断发展,互联网用户和互联网站数量都在不断的增长。对网络服务器的可用性、可扩展性和安全性的要求越来越高。传统的单服务器模式,已经不能满
在多Agent系统理论中,为了尽可能细致的刻画Agent合理的行为能力,人们提出了合作的概念。其中,最为自然的一种合作形式就是联合,即系统中Agent个体保持和团体完全相同的价值
在信息和知识经济时代伴随着计算机技术和网络技术的不断发展,企业纷纷建立自己的商务网站,开展电子商务活动,日积月累网站上生成了大量的与客户有关的记录信息,这些信息对企业来
随着Internet的发展,互联网络环境下的信息安全由于涉及到国家安全和社会稳定,已日益受到各国政府部门和社会各界的重视。信息安全的关键内容是密码技术,而密码技术的核心则
随着信息技术的发展,人们在日常事务处理和科学研究中积累了大量宝贵的数据。如何从中提取或挖掘用户所需要的信息,是当前信息科学和技术领域面临的一大挑战。关联规则(associa
随着社会的进步和汽车工业的飞速发展,汽车的安全问题被提到一个前所未有的高度。汽车防抱死制动系统(Anti-lock Braking Systcm,简称 ABS)是一种主动安全装置,它能够提高汽车的
Web使用挖掘是Web挖掘领域中的一个重要研究方向。它对于发现用户访问网站的规律、提高Web系统的性能和实现Web系统的个性化服务等方面都具有重要意义。将Web使用挖掘技术和
在当前的电脑游戏中,图形质量的发展已经到了近乎极至的水平,人工智能已经成为决定游戏成功的重要因素,越来越多的游戏开发者和研究者开始将重点转移到游戏中的人工智能研究