结合内容与链接分析搜索特定主题的权威Web信息源

来源 :河海大学 | 被引量 : 4次 | 上传用户:yxl0173
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎是目前最主要的Web信息检索工具,然而搜索引擎的效果还不能令人满意。因此,在搜索结果返回用户前需要有一个检索后处理过程,即主题精选过程。当前很多Web检索系统能以页面和站点两种粒度向用户提交检索结果,但现有的主题精选算法均以页面粒度来建立链接图。这种模型不仅不能满足用户多粒度的信息需求,而且意味着给不同的Web站点作者规定了不平等的影响权重。此外,主题精选经典算法HITS的链接分析迭代往往会收敛于链接图中与查询主题不太相关的紧密交织区域(TKC),从而导致主题偏移。本文对HITS进行改进,提出一种结合内容分析与链接分析的多粒度主题精选算法g-HITSc。算法可根据用户选择以页面或站点粒度构造链接图,通过内容分析计算图中结点的主题相关度权重并排除低相关度结点,运用加权I/O操作进行迭代计算。理论分析和实验结果表明新算法能避免主题偏移并识别更为合理和有意义的权威信息源与中心信息源。
其他文献
论文详细研究了GPRS网络的体系结构;协议;QoS机制以及保证QoS前提下GPRS网络协议的应用.论文首先从无线移动通讯入手,介绍了无线网络体系结构及相关协议,进而分析了无线网络
该论文通过对首都机场自动广播系统的现状分析,总结了以往系统的可取之处和不足之处,并结合对乌鲁木齐机场自动广播应用需求的分析,提出了通用数字自动广播系统的功能需求与
首先,文中论述了三种典型的分布式VoD服务器(层次型DVS、网状DVS和基于集群服务器DVS)的节目存储和轮换策略.其次,经对中山大学软件所VoD系统的用户点播数据进行细致分析,发
该文所介绍的实例CRP是一个适合中小学校园资源管理的一个平台,它包括了学籍管理、成绩管理、排课管理等各个管理子系统,为校园办公和资源管理提供信息化解决方案.该文介绍了
随着对外开放的不断深入,我国英语学习者的数量急剧增加,对英语学习者的文章进行相关分析研究显得日趋重要。英文作文智能评改系统综合利用自然语言处理、统计学、语料库语言
随着信息技术的飞速发展,特别是互联网技术的普及,每天产生的数据呈现爆炸式增长,这些数据基本都具有:高速到达、数据量大、实时性要求高等特点,是典型的数据流。如今,数据流
近些年随着互联网和流媒体技术的发展,流媒体服务逐渐成为互联网的重要应用,并且趋向于向大规模、高质量的方向发展。大规模流媒体服务也成为近年来的研究热点。相关研究表明
该文根据PVM模型,使用JAVA和CORBA实现了一个网络环境下异构的并行虚拟机,与传统的并行虚拟机PVM相比其特点如下:将CORBA技术引入并行处理,通过ORB作为底层的通信渠道,使得并
引入移动Agent技术,利用其在代码移动方面的优势,可以解诀移动嵌入式计算中资源受限的难题.该论文提供了从移动Agent规范到移动计算的Agent平台直至移动嵌入式终端软件的一整
万维网自二十世纪九十年代初有了第一个真正意义上的网页以后,其信息量与日俱增,人们因此庆幸摆脱了信息匮乏的困境。然而,万维网信息的海量性、复杂性、分布性以及非结构性,使人