分布式Web信息采集系统的研究与设计

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:silent_snake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统进行了仔细的剖析。最后,对分布式Web信息采集的发展作了一个展望。
其他文献
责任性是电子商务安全性的基本要求之一,它要求交易各方对自己的行为负责。Kailar逻辑是专门针对电子商务责任性进行分析的逻辑。然而Kailar逻辑也存在不足。该文讨论了Kailar
基于面向对象的柔性设计与控制理论,提出了软传感器对象概念,并对其结构、功能与实现方法进行了论述。软传感器对象为智能传感器的设计提供了新途径,为传感器故障诊断和数据有效
人工神经网络(ANN)是一门崭新的信息处理学科,它研究非程序的、适应性的、大脑风格的信息处理的本质和能力,在众多的工程领域有着很好的应用。论文阐述了ANN技术的特点,根据铁路
嵌入系统在严格的时间约束(外部约束)下连续地与外界环境相互作用,把这些外部约束转换成系统任务的时间预算(内部约束)是非常重要的。知道这些时间预算能降低系统设计与验证问
研究梳棉机刺辊速度变化对大漏底落物质量的影响问题.用AFIS单纤维测试仪对梳棉机在4档刺辊速度条件下的大漏底落物和盖板花中纤维各项指标进行了检测和比较.结果显示,刺辊速
该文详细阐述了一种新兴的数据挖掘方法——神经规则法。文中先后介绍了神经网络的训练、神经网络的剪枝以及神经规则的提取。最后用一个实例具体解释了使用该方法来挖掘分类
中文分词作为中文信息处理最重要的预处理手段被广泛应用,该文从两个方面(检索精度和召回率)深入研究了中文分词精度和分词算法对中文信息检索性能的影响。此外,提出了两个假设
我公司现有英格索兰EP50S型空气压缩机3台,长期处于满负荷运行的状态。经过多年的使用,空气压缩机的故障及维修费用也越来越高。现列举3例维修经验供同行参考。(1)空压机正常运行
探讨浆印工艺应用于开发家纺织物的要点。分析了印经工艺的优越性和可行性,开发了对应的浆印设备。介绍了其结构和安装使用方法;在不同组织的织物上进行了试验,结果表明:缎纹织物
研究云母改性涤纶纤维的常规性能和热湿性能。在测试分析云母改性涤纶纤维常规性能的基础上,重点研究了云母改性涤纶纤维的热学性能、降温性能和吸放湿性能。结果表明:与普通涤