Web信息检索的关键技术研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:yueyemingchan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,Web正在日益成为一个重要的信息来源.如何对Web信息进行整理和检索,使得用户能够更好地利用Internet上的信息资源,是一个迫切需要解决的问题.因此,基于Web的信息检索技术越来越受到人们的重视,也是当前研究的前沿课题.该文工作主要集中在Web信息检索领域,设计并实现了一个Web信息检索系统,并使用该系统和相关模块参加了第十一届文本检索会议(TREC)和2003年度863计划中文计算机全文检索系统的评测,均取得了较好的成绩.该文介绍了Web检索的核心技术,包括三种经典的检索模型:布尔检索模型、向量空间检索模型和概率检索模型.介绍了最短片断检索算法,并且给出了针对最短片断算法改进的扩展布尔检索算法,提高了Web搜索引擎的检索精度.该文论述了利用链接信息优化Web检索的技术,介绍了目前流行的多种链接分析方法,并对其逐一作了详细的讨论.对这些方法作了分类和评价,总结了目前的链接方法的优缺点,揭示了其背后的本质和理论假设,并作了一些讨论和展望.该文同时描述了一种利用链接信息检索Web关键资源的算法,详细介绍了该算法的体系结构和实现细节.该算法的核心为基于网页的文档评分计算其链接评分,并将综合网页内容、结构评分和链接评分得到网页的综合评分.其本质是增加链接分析的有效性,从而提高Web检索的整体性能.
其他文献
电子政务互操作系统数据建模,是电子政务应用体系构架的重要内容。当今围绕着数据建模有多项标准和技术,标准有XML、UML、MOF、Web Service等,围绕着这些标准,出现了多种技术,如基
随着信息时代的到来,企业在发展过程中,积累了大量纷杂数据,如何利用这些数据来指导企业决策分析,是企业能否在竞争中取得经济效益的关键。数据仓库技术的出现满足了决策支持
本文系统地研究了有线和无线两类对等网络计算环境中,结点用户兴趣和运动特性对于网络拓扑和系统性能的影响.提出了在无线对等网络中使用相似运动特征组算法捕获移动结点运动
XML已经成为互联网上数据发布和交换的事实标准,而Xquery作为XML查询语言的标准也广为接受.对XQuery查询语句的分析可以提高查询效率,优化查询过程.基于这一点,该文对XQuery
软件的规范说明阶段(specification phase)对于软件整体开发过程来说是一个非常重要的阶段,它可以被认为是需求分析的一部分。用自然语言来说明软件需求的优点是直观易懂、方
IEEE在2003年和2006年发布了802.15.4无线个人区域网络标准(Low-Power Wireless Personal Area Network, LR-WPAN)的第一版和第二版,为使用低数据传输率、低能量消耗、低复杂
随着人们对更真实体验和更智能交互的追求,虚拟现实技术与深度学习技术成为了当前的研究热点。本文提出基于Leap Motion设备结合机器学习算法进行手势训练与识别的方法,并将该
软件配置管理(SCM——Software Configuration Management)是指通过技术及行政手段对大型软件产品的团队开发进行控制、规范的一系列方法、工具和过程。它通过标识、记录、控
随着移动通信和互联网技术的飞速发展,信息处理出现了新的模式,信息融合技术面临了新的挑战,如何让人们在任何时间任何地点以任何方式能够访问到任何感兴趣的有效的信息服务,目前
嵌入式系统在生活中的应用越来越广泛,它是计算机系统影响人们生活的最重要的方面之一.各种各样的嵌入式硬件,软件层出不穷.它和桌面PC不同(基本上是Wintel模式),它的硬件种