聚焦爬虫爬行性能研究

来源 :科技资讯 | 被引量 : 0次 | 上传用户:hgq41102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
爬虫作为网页搜索下载程序,其网络爬行性能决定了搜索引擎的性能和数据质量。本文通过分析聚焦爬虫的特点和网络环境,总结出三类制约爬行性能的主要问题,分别是DNS查询及缓存设置、内外部分布式爬行特点和网页URL静态与动态分配策略。结论为聚焦爬虫使用URL静态分配策略结合异步DNS查询及缓存设置,在内部分布式爬行时可有效提高网络爬行性能。
其他文献
我国经济发展阶段已从高增速发展转变为高质量发展,当前正面临发展方式转变、经济结构优化、增长动能转换的关键时期。建筑业作为国民支柱产业之一,也身处转型和创新发展的重
对病害混凝土桥梁的整治加固以及提高承载能力,己经成为桥梁工程的重要课题之一。体外预应力现阶段主要应用于预应力混凝土桥梁重建、加固及维修;论文首先概括了体外预应力技
随着移动互联网和线上教育服务平台迅猛发展,在线教学被高校师生逐渐认同接受并被尝试应用,具有不受时空限制、师生互动性高和教育可持续性强等优点,但在应用过程中,也存在亟
摘 要:本文从素质教育的客观要求出发,探讨了当前语文教学存在的问题,分析了存在的原因,并从四个方面就解决的途径即提高语文教师的整体素质进行了探索。  关键词:素质教育 语文教师 要求  中图分类号:G633 文献标识码:A 文章编号:1672-3791(2012)11(a)-0218-01  从我国当前语文教学的现状来看,其实际状况较令人担忧。分析原因,我们发现主要是语文教学没有按照素质教育的客观
目的探讨瑞巴派特片对治疗幽门螺杆菌(helicobacter pylori,Hp)阳性消化性溃疡效果与复发的影响。方法选取2018-10至2019-09武警北京总队医院接收治疗的Hp阳性消化性溃疡患者
本文基于笔者多年从事MapGIS应用的相关工作经验,以第二次土地调查中MapGIS技术的应用为为研究对象,全面探讨了MapGIS在第二次全国土地调查中的应用方向,重点分析了在数据采集、属性数据采集、分幅数据接边和投影变化四个方向的技术途径,全文是笔者长期工作实践基础上的理论升华,相信对从事相关工作的同行有着重要的参考价值和借鉴意义。