对搜索引擎中垃圾数据Spam的识别分析

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:BBQChris
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
垃圾数据Spam是搜索引擎要面对的数个“敌人”之一,解决好了这个问题就能够有力提升搜索引擎的效率。对此,本文简要介绍了垃圾数据Spam带来的危害,分析了它的分类并根据其分类介绍了一些传统的识别策略,最后针对它分类中的链接型欺骗Spam提出了一种简单的识别策略并简要分析了这种策略未来的优化方向。
其他文献
ZigBee技术具有低复杂度,低功耗,低成本等优势,在监测和控制领域具有广阔的应用前景。为了解决嵌入式ZigBee通信设计问题,本文介绍CHIPCON公司的CC2430如何实现通过串口与终端通
在访问控制领域,基于XACML的组合算法是解决策略/规则冲突的方法,当主体的请求数目达到一定规模后,为了将PDP模块进行评估的时间缩短,势必要考虑该算法的优化问题。在对XACML
○取消设施农用地审核,改为备案制  ○配套设施纳入设施农用地管理,经论证可占用基本农田  ○严格界定设施农用地范围,加强设施农业用地执法、监管  日前,国土资源部、农业部联合下发《关于进一步支持设施农业健康发展的通知》,在加大政策扶持力度保障设施农业合理用地需求的同时,进一步强化执法监管,规范设施农用地的使用。  这项在2010年《国土资源部农业部关于完善设施农用地管理有关问题的通知》基础上出台的
本文基于IEEE802.15.4无线标准对射频模块的软硬件进行了设计。为了增加发射距离,射频部分采用外加功率放大器(PA)的方法。整个射频模块通过ADS2005A仿真,各项性能均达到技术指标,实
有人形象地用"者、师、家"来比喻设计实践类学生的三个学习阶段.本科教学以培养学生掌握基本专业技能,毕业后能用专业的技能服务于社会.我们称其"设计者".而研究生的硕士阶段
期刊
由于无线网状网具有多网卡多信道、节点移动性低等特性,使用传统的基于最短路径的移动AdHoc网络路由协议并不能获得良好的性能,为此提出了一种新的无线网状网路由协议——MR-
本文以老子哲学为参照 ,释读了米修的诗作 ,努力揭示米修与道家的深层关系 ,突出文本分析。
采用自制板带式高温摩擦磨损试验机模拟实际热冲压条件下22MnB5硼钢裸板的高温摩擦过程,对模具进行预热,模拟了热冲压过程中的模具升温,并通过硼钢热冲压的摩擦因数、表面磨
本文采用一种音素匹配法结合改进了的n元语法模型的方法,对语音指令进行理解。指令按照结构划分类别,通过提取其中关键要素来获取指令语义。音素匹配法可以提取指令中部分或全部要素;对于指令中未识别的要素则根据已正确识别的部分,采用改进的n元语法模型进行推测。实验表明该方法取得了较好的效果,并在原有的基础上有一定的提高。
在分析当前信息检索存在问题的基础上,以及简单介绍现有相关反馈和伪相关反馈的优缺点基础上,提出一种新的首页相关反馈的查询扩展方法,并引入网页特有的特征项给出一个改进