网络机器人多线程爬行的研究与实现

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:linnber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多线程爬行是高效率网络机器人实现的关键。分析在单个计算机节点上网络机器人多线程爬行的关键流程,并借鉴硬件指令流水线的执行过程研究不同多线程并发调度策略下系统的性能特点。最后,给出实现网络机器人多线程爬行的关键数据结构、并发调度方法及URL消重策略。实验数据表明:有效地控制并发和有选择地消除重复URL可以提高网络机器人的爬行速度。
其他文献
基于动作的视频交互游戏一直是游戏市场上非常受消费者青睐的主流游戏之一。研究利用Kinect从用户动作中获取低维控制信号,然后通过双级结构来重建高维度运动控制信号,以实现高质量人体动画的实时合成。其中第一级先通过构造一个邻居图缩小搜索空间,再通过K-D树加速搜索算法得到k个相似数据,最后基于主成分分析法来构建一个线性运动实时合成模型;第二级则是利用平滑参数对线性模型进行优化。实验结果表明,即使在场景
归化(domesicating)和异化(foreignizing)是每个译者在翻译实践中尤其是文学作品的翻译时都会面临的问题。因为翻译是用一种语言复述另一种语言传达的内容,而语言历来被视作文
建模是系统开发过程中十分重要的一步,传统的图形化建模工具,不能对系统设计的可行性作出定量的分析。提出一种新的软件建模思路,应用工作流网技术完成了对电子商务平台的建模,解决了电子商务平台业务流程与网上银行业务流程的协作问题。运用关联矩阵和状态方程,精确分析了模型的重要性质,应用Petri网模拟分析工具PN-applet,对系统模型进行了模拟运行,并评价了系统设计的可行性,对系统开发有积极的指导意义。
详细介绍了国内外对于CO2+H2合成甲醇反应的研究概况,其中有关不同种类催化剂的特性及反应机理的研究报道,以及对反应产物结构的探讨和热力学分析,对于工业合成甲醇具有重要
叙述了近年来国内甲烷化学及合成气化学进展概况。
论述高校国有资产管理面临的现状,分析在市场经济体制下国有资产管理存在的问题。在剖析这些存在的问题的同时,提出了一些相应的对策,以供选择。
人工神经网络在集群上的并行化设计和实现能够充分发挥ANN并行处理的特点,缩短训练时间,降低算法复杂度。随着并行技术的日益成熟,在并行集群上以软硬件相结合的方式设计神经网络的重要性也不断提高。从软硬件平台的多方面讨论了并行集群技术对人工神经网络设计的支持,提出了一种SOM神经网络在并行集群上的设计方法和基础框架,并就并行集群上神经网络训练效率的问题进行了深入讨论。该方案可广泛应用于多种神经网络模型的
采用氢气脉冲吸附色谱法测定了3种天然气蒸汽转化催化剂对氢的化学吸附量,计算了镍表面积和镍平均晶粒度,用TPD法考察了催化剂表面氢吸附中心类型。结果表明:催化剂镍表面积