Co-Training——内容和链接的Web Spam检测方法

来源 :计算机科学与探索 | 被引量 : 0次 | 上传用户:a9228144
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web spam是指通过内容作弊和网页间链接作弊来欺骗搜索引擎,从而提升自身搜索排名的作弊网页,它干扰了搜索结果的准确性和相关性。提出基于Co-Training模型的Web spam检测方法,使用了网页的两组相互独立的特征——基于内容的统计特征和基于网络图的链接特征,分别建立两个独立的基本分类器;使用Co-Training半监督式学习算法,借助大量未标记数据来改善分类器质量。在WEB SPAM-UK2007数据集上的实验证明:算法改善了SVM分类器的效果。
其他文献
本文力图对车尔尼手风琴练习曲第四册的技术类型进行分析,对练习曲在日常教学中的训练方法展开论述,以求从理论的研究出发探索手风琴高难度演奏技巧的掌握与提高,通过对此教材技
动态优化是计算系统虚拟化的重要支撑技术之一。与虚拟化技术一样,多核时代的到来同样给动态优化机制的发展带来了新的机遇。通过对Dynamo、Pin、Jrpm等典型动态优化和插桩系
1921年《民国日报·觉悟》上发表的两篇署名“树人”的文章从许多方面考察都应是出自鲁迅之手,《邵力子年表》也径自将其认作鲁迅作品。但是查阅相关当事人的日记、书信等
在幼儿语言学习的过程中,容易受到直观信息的刺激,而对枯燥的文字难以产生兴趣。因此,教师便可以充分利用多媒体设备呈现生动形象的语言信息,有效激发幼儿学习语言的兴趣,为提高幼
英语听力教学是中学阶段英语教学的一个重要组成部分,它关系到学生英语学习的长远发展。从语境理论和听力的相关内容出发,介绍了目前我国中学英语听力教学的一些问题,并探讨
微课教学为高中数学教学注入了新的活力,其规模小、参与性强、针对性强等特点,成为高中数学教学中一种十分有效的补充教学手段。结合自身的实际教学经验,就微课在高中数学教
研究了采用网络距离的道路网上移动对象连续多范围查询处理技术。设计了道路网、移动对象和查询数据在内存中存储的数据模型。基于该数据模型提出了两种道路网上的移动对象连
采用快速镍及高效铬电刷镀溶液及工艺,用于磨损的机械零、部件的修复和工件的表面强化,可以使不少因磨损而失效的零、部件“起死回生”.
期刊
金佛手,属柑橘 (云香) 科,原产江南诸省.它形如观音手指,又称"观音指果”,极具观赏价植.果实香气浓郁,可持续数月不退,独特芳香的气味,馨人心脾.古代皇宫常有摆设金佛手的场
期刊