基于限制标记传播的搜索引擎反链接作弊方法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:caery
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今网络环境下,搜索引擎是人们获取信息的一条主要途径。然而搜索引擎的发展受到了搜索引擎作弊行为的挑战。搜索引擎作弊行为定义为采用一些刻意设计的机制来提高网站或网页在搜索引擎结果中排名的行为。进行搜索引擎作弊行为的网站就叫做作弊网站。作弊者为了达到他们的目的,会仔细研究搜索引擎的排名算法,找出排名依据的主要因素加以利用。所以,搜索引擎作弊是搜索引擎面对的最主要挑战,如果不采取措施,搜索引擎的结果会被严重干扰,导致许多人不再信任搜索引擎。由于搜索引擎作弊技术在不断进化,其方法也多种多样,再加上互联网数据的庞大性,这些因素都给反搜索引擎作弊工作带来了困难。从搜索引擎作弊出现至今,人们已经提出了多种多样的应对不同类型搜索引擎作弊的策略。本文首先分类说明了了常见的搜索引擎作弊方法,包括基于内容的、基于链接的和基于隐藏页面的。之后详细介绍了已有的几种代表性的搜索引擎反作弊算法。同时提出了已有的主流反作弊方法,即基于标记传播的方法的缺陷。本文进一步提出了限制标记传播的反作弊方法,先使用随机游走获取到作弊社区群,然后根据作弊社区群的信息对信任值标记和作弊值标记在网络中的传播进行限制,在一定程度上弥补了已有算法的缺陷。通过在多个真实数据集上的实验,证明了限制标记传播的算法相比已有的标记传播算法效果的提升,改进了搜索引擎反作弊的质量。
其他文献
社交网络在给用户带来便利的同时,也存在个人隐私泄露的严重风险。论文结合课题组所承担的重大科技专项,研究社交网络隐私保护技术,具有重要的研究意义和应用价值。论文首先
  随着 Internet 技术的迅猛发展,传统搜索引擎的局限性如覆盖率低、时效性差、结果不准确等日趋明显,针对以上情况,主题搜索引擎悄然出现。主题爬虫作为主题搜索引擎的核
互联网和无线网络为信息传递和交换提供了广泛渠道。由于互联网的兴起,信息安全成为了信息科学和通讯中最重要的因素之一。信息隐藏也被应用于军事、情报机构、非法和犯罪活动
随着网络信息化的快速发展,网络用户的持续增加,互联网由传统的PC时代逐渐向移动时代转变,用户对于存储的需求持续增加,传统的存储模式已逐渐无法满足用户对于存储的需求,一种新的
在经济全球化的时代,越来越多的经济活动是以项目的形式执行的,并且通过项目管理的方式,对项目中的各种资源(人员、设备等)进行有效的组织,控制项目的执行成本,在一个确定的时间范
用户一般通过搜索引擎来查询所需信息,而搜索引擎的返回结果很多,每个检索结果并不一定都是符合用户需求的。同时由于教育文化背景的差异,用户即使有相同的查询意图,但其提交
随着互联网技术和计算机技术的快速发展,数字化教育在人们的学习和生活中,起到了越来越重要的作用。在当前的信息环境下,大量教育资源和用户快速获取个性化学习信息资源之间的矛盾日益明显,导致了无处不在的学习(ubiquitous learning)演变为无处不在的搜索(ubiquitous search)。在教育领域中引进个性化推荐技术,并结合泛在学习资源的特点,能够帮助用户获得个性化的学习资源,因此,本
学位
随着互联网的发展,视频成为网络信息的主要载体。据统计,40%以上的网络流量来自于流媒体。虽然国内外学者针对网络流媒体应用已经提出了很多研究成果,但网络流媒体仍然存在很
网络与信息安全中有两个重要的研究方向,一是研究如何保护主机或者网络免受攻击危害,如入侵检测系统,研究人员将生物免疫系统建模后用于入侵检测系统,提高了入侵检测系统的积极主
WebRTC是近年来兴起的一种基于Web的实时通信技术,已在行业内得到广泛的支持和应用,有望成为下一代视频通话的标准。但目前WebRTC在移动网络环境中的性能表现较差,同时由于不