网页监控分布式爬虫

来源 :现代计算机(专业版) | 被引量 : 0次 | 上传用户:wwyufo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的飞速发展,改变人们获取信息的方式,互联网渐渐取代传统媒体,现在每天都有海量的信息在互联网上更新着,如今世界已经进入到以数据为中心的大数据时代。提出一种监控这些数据的分布式爬虫技术,以及一种基于网页结构的提取网页更新内容的算法。
其他文献
目的观察急性高容量血液稀释(AHH)联合乌拉地尔控制性降压对手术患者血液动力学、组织灌注、出血量和输血量的影响。方法选择静吸复合全身麻醉下脊柱外科胸、腰椎内固定手术48
In this paper we shall extend Hardy’s inequality associated with Fourier transform to the strip n(2-p)≤σ<n+p(N+1)where N=[n(1/p-1)],the greatest integer not
奥地利的维也纳大学、英国的伦敦经济学院、美国的芝加哥大学、西德的弗赖堡大学,是现代资产阶级经济学中经济自由主义思潮的四个重要的中心,它们曾分别以新奥国学派、伦敦学派、芝加哥学派和弗赖堡学派而著称。但十分引人注意的是:
随着汽车产业的发展,汽车给我们带来便利的同时也给我们带来一系列的问题,例如交通拥堵、交通安全等。为了解决这些问题车载自组织网络应运而生。但是车载自组织网络中信息安全
为了减小表情变化对三维人脸识别带来的影响,提出一种由粗到细的识别方法。以人脸的深度数据为整体特征,采用Fisherface(PCA+LDA)方法进行匹配,以面部刚性区域作为局部特征采用改进的迭代最近点(ICP)算法进行比配,将得到的整体特征和局部特征进行融合。实验结果表明,该方法能有效提高人脸识别系统针对表情变化的鲁棒性。
In this paper, we prove the existence of the pullback attractor for the nonautonomous Benjamin-Bona-Mahony equations in H 2 by establishing the pullback uniform
《数据库应用》教学中查询语句是重点和难点,使学生读懂查询代码、熟练地写出复杂的查询语句是教学中要达到的目标。论述教学中总结出的查询语句的一些特点,例如查询语句的各子
结合实例从以下几方面论述了医学论文结构式摘要的撰写要求:内容要详略得当、突出"新";表述应注意结论和目的要相对应、方法和结果要相呼应、结论要从结果中能推出;用词要准确;
周日如果没有什么事,我还是要去办公室一趟,哪怕是开窗通通风,或者给几盆花浇浇水。那个周日,天气很好,我的心情也很好,所以当魏博士溜进我办公室后,我很耐心地听他阐述了他
期刊