基于内容与链接特征的中文垃圾网页分类

来源 :微计算机信息 | 被引量 : 0次 | 上传用户：zhym821211

【摘要】

：

随着搜索引擎使用的日益普及,web作弊已成为搜索引擎面临的一个重大挑战。国内外研究人员从基于内容,基于链接等方面提出了许多反web作弊的技术,这些技术一定程度上能有效地

【作者】

：

刘卫红方卫东董守斌张凌

【机构】

：

华南理工大学计算机学院

【出处】

：

微计算机信息

【发表日期】

：

2010年9期

【关键词】

：

网页作弊搜索引擎机器学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着搜索引擎使用的日益普及,web作弊已成为搜索引擎面临的一个重大挑战。国内外研究人员从基于内容,基于链接等方面提出了许多反web作弊的技术,这些技术一定程度上能有效地检测垃圾网页。本文在前人研究基础上提出了一种结合网页内容和链接方面的特征,采用机器学习对中文垃圾网页进行分类检测的方法。实验结果表明,该方法能有效地对中文垃圾网页分类。

其他文献

存在主义团体心理治疗促进康复期精神分裂症患者家庭关系及社会功能的研究

目的探讨存在主义团体心理治疗在促进康复期精神分裂症患者家庭关系及社会功能的作用。方法对42例患者进行存在主义团体心理治疗。运用中文版家庭环境量表、中文版家庭亲密度

期刊

精神分裂症家庭关系社会功能存在主义心理治疗

食品理化检验分析中的质量控制探讨

随着人们生活水平的提高,食品种类也日渐繁多,食品的安全问题被提上日程,在一定程度上也在考验食品检验工作者,尽管现在的检验器械得到了升级,但是实验室的环境、检验分析方

期刊

食品理化检验食品检验技术控制探讨

茶麸和茶麸缓释肥对草坪蚯蚓的毒杀作用

就一种茶麸和茶麸缓释肥对草坪蚯蚓的毒杀效果进行研究。结果表明，荼麸和茶麸缓释肥均对蚯蚓有较好的毒杀作用。处理8d后的毒杀效果最好，2mg／mL的茶麸粉和茶麸水对蚯蚓的毒杀效

期刊

草坪茶麸缓释肥蚯蚓毒杀作用

一季度游客满意度“一般”

本报讯（实习记者郭探微）4月10日，中国旅游研究院在京发布第一季度全国游客满意度调查报告及中国公民出国旅游满意度调查报告。$$ 一季度全国游客满意度调查报告显示，全国游客

报纸

基于嵌入式技术的采煤机调速控制装置研究

通过对采煤机工作时调速特性的研究,提出了基于嵌入式技术的采煤机电磁调速控制系统,对该控制系统的总体结构及工作原理进行了分析。分析认为,该电磁调速控制系统克服了传统

期刊

嵌入技术采煤机电磁调速

人生三境界

人生有三重境界。这三重境界可以用一段充满禅机的语言来说明，这段语言便是：看山是山，看水是水；看山不是山，看水不是水；看山还是山，看水还是水。

期刊

三境界三重境界

备战奥运中国优秀游泳运动员高原训练学特征的研究

：跟踪研究国家游泳队与浙江游泳队共18名优秀游泳运动员冬训期昆明高原训练的全过程，旨在了解其高原训练过程的训练方法及特征、训练监控和评价训练效果，探索我国游泳运动项目高

期刊

备战奥运优秀游泳运动员高原训练

引进美国烤烟品种对海拔高度的敏感性研究

为研究烤烟品种的生育期及综合性状对海拔的敏感性,通过大田试验对种植在海拔1690m、1960m两个试验点的8个从美国引进的烤烟品种进行了对比试验。结果表明:(1)各品种种植在低

期刊

烤烟品种海拔高度敏感性

以大数据分析平台为基础的加油站升级管理

在消费者主权时代,如何利用大数据平台精准划分加油站商圈,实现精准化营销投放?如何通过全渠道客户标签和视图创建,获得丰富全面的客户洞察,针对性设计组合营销策略?如何建立

期刊

加油站油品销售大数据平台大数据分析平台

基于不同工况下辅助数据集的齿轮箱故障诊断

针对变工况下齿轮箱监测数据重用性低,受复杂工况影响大和已训练模型经常失效的问题,提出基于不同工况下辅助数据集的迁移成分分析方法用于设备故障诊断.迁移成分分析（Transfe

期刊

齿轮箱不同工况辅助数据集故障诊断迁移成分分析

基于内容与链接特征的中文垃圾网页分类

与本文相关的学术论文