Web信息搜索技术的研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:jiaoranbuzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着万维网的发展,Web上的信息资源正在以前所未有的速度增长。面对海量的数据,用户常常无法从中找到自己所需要的数据。如何使用户能够在网络中快速,准确的找到所需要的数据是Web信息检索面临的挑战。 搜索引擎技术的出现,为用户提供了一种在Web中检索信息的简单的方法,使用户能够通过关键字进行相关资源的搜索。但是用户所需的资源种类不同,通用搜索引擎难以提供给用户足够的资源,因此出现了针对特定领域的搜索服务。RSS新闻搜索就是这类应用,它仅仅搜索RSS新闻资源。同时,越来越多的网络应用采用了B/S模式,因此出现了许多集成在浏览器上的搜索服务,并提供其他方便用户的附加功能。 本文首先介绍了信息检索技术的基本概念和模型,介绍了搜索引擎和元搜索引擎的基本结构;对基于链接分析的搜索引擎排序算法PageRank和HITS进行了分析和对比,在此基础上提出了基于概念的权重PageRank改进算法以及为页面标记概念的两种方法;提出了基于用户反馈的结果融合排名算法;详细介绍了RSS新闻搜索平台的结构,数据库模式设计,搜索操作的性能优化方法,主客观结合的新闻排名机制;最后介绍了一种浏览器插件,它主要提供一种为页面进行概念标记的方法,同时提供元搜索接口等其他服务。
其他文献
微博是近年新兴的网络媒体传播平台,它具有内容简短、传播速度快、用户众多等特点,而对于微博文本的情感分析是近年来数据挖掘的热点之一,具有重要意义和价值。用户在实施网上购
本文分析了无线传感器网络的体系架构,并跟踪国内外在无线传感器网络协议领域的最新进展,对网络层和MAC层的几个比较流行的协议进行了比较与总结。文章着重介绍了CBIR路由协议
随着无线数据通信技术的日益成熟,基于IEEE 802.11协议的无线局域网接入技术以其安装便捷、组网灵活、可移动性、成本低廉、可扩展性强等优点在近几年表现出良好的发展势头。
多Agent系统(MAS)及其相关技术近年来受到越来越多的研究者的关注,被广泛应用到Internet、办公自动化、冲突协调、决策支持、开放式信息系统等众多领域。其中基于Agent的仿真
随着Internet的迅猛发展,Web上可获得的Web服务的急剧增多,如何从庞大的服务群中有效地获得所需功能的Web服务和如何在功能相似的Web服务中找到最佳服务成为了值得关心的问题
Web服务(Web Services)作为一种能够快速集成应用的技术,在电子商务中已得到广泛应用。Web服务体系结构的本质是应用程序通过消息交换进行相互集成,而由于目前在Web服务中广泛
近年来,油气资源开发的技术难度、投资额度和风险程度日益增高。油藏工程已发展为制定及优化油藏管理经营策略的进程。如何运用油藏工程分析方法正确地处理和有效地使用油气生
过程层析成像(PT)技术是近年来飞速发展起来的一门新技术,该项技术在解决多相流检测问题上有巨大的发展潜力和广阔的工业应用前景。它是将医学工程中已成功实现的断面(层析)
当前,虚拟试验在军工领域的应用取得了长足的发展,并成为国防技术研究的重要领域。虚拟试验的开放性以及数据的庞杂性,决定了必须要有强大的数据库支持。因此,研究虚拟试验中的工
现有的EDGE(EnhancedDataratesforGlobalEvolution)技术8个时隙全部使用时总处理能力可达473.6Kbps,基本可以满足大部分现有的分组业务,然而对于许多对流量和时延要求较高的数