爬行虫算法设计与程序实现

来源 :计算机应用 | 被引量 : 41次 | 上传用户:ccb332
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
爬行虫算法是搜索引擎探讨的热点。通过分析现有爬行虫算法设计和程序实现的主要方式 ,权衡其利弊 ,总结出一个适合于中小型网站网页下载的爬行虫算法。并使用jBuider8.0工具实现了该算法。通过实验分析 ,该程序下载的网页数的速度为 1882 4 2个网页 /分和 4 1.92 74 .5 9KB/秒。
其他文献
以对“人文奥运”的解析为起点,引证了未来是一个休闲时代,在这样的历史背景下,提出了北京奥运会应当提倡中国的休闲文化;阐述了北京奥运会对中国休闲文化的忽略,并提出了些许的展
在评述集成风险管理理论进展的基础上 ,指出了机构投资者集成风险管理信息系统(IRMIS)的复杂自适应系统 (CAS)特征 ;引入网格计算思想提出了基于网格计算的机构投资者IRMIS的概念、特点及其系统原型 ,该原型具有多智能体 (Multi Agent)的良好结构 ,并基于管理熵对原型各Agent间的耦合关系进行了优化 ,强调风险管理战略、组织、方法、文化和过程诸要素的集成性
以首都体育学院体育教育专业2001—2004级426名学生(男生337名、女生89名)为实验对象,经过四年的实验研究,结果发现,体育教育专业体操课程技术考试必须改革,通过考试方式的改革,不仅
利用机器视觉技术把杂草精确识别出来是精细农业领域研究的热点问题之一。针对杂草与小麦叶子交叠的情况,提出一种综合颜色和形态特征的方法进行杂草识别。在L*a*b*颜色空间,选取a*作为特征量并用改进的最大类间方差法进行阈值分割获得植物图像;在HSI颜色空间,利用多层的同质性分割算法分离小麦与杂草;结合形态学特征开闭运算滤波及二值逻辑与运算获得杂草图像;模拟化学除草系统,从理论上评价整个系统的识别效率。
采用社会调查法、文献资料法等研究方法,对辽宁省14个城市的田径赛事状况进行实地调查。结果表明,影响辽宁省田径赛事市场运作的因素有体育经济环境因素、体育政策环境因素、田
如何为IP网络中的业务提供QoS保证正成为IP技术所要解决的关键问题。文中基于DiffServ提出了一种IP电话QoS方案,并对其基本思想及实现方法作了详细介绍。该方案将不同的分组数据包设置成不同的优先级,其中系统控制分组数据包优先级最高,语音分组数据包次之,普通数据分组数据包最低,使得系统控制分组和语音分组数据包的平均等待时间缩短。研究结果表明,对不同数据包进行优先级设置是改善IP电话QoS的一
对我省少年篮球运动员部分身体素质形态和基本技术的调查与分析李国岩,张大伟,梁薇(烟台师院)(山东机械学校)(烟台芝罘体校)为检查我省少年篮球业余训练水平,落实90年国家体委颁布的“全
完善项目纵线训练体制的几点思考车保仁,傅砚农,于军(烟台师院)近些年来,项目纵线训练体制在培养体育后备人才、提高我国竞技体育水平方面,业已显示出它的作用和优势。我们认为:省市
介绍了一种新的基于速率的拥塞控制方法,重点讨论了速率控制方法在流媒体网络传输中的具体应用。该方法通过监测网络状态变化和客户端缓冲区状态,动态调整服务器端的发送速率,以提高服务质量。研究表明,相对于传统的基于窗口型拥塞控制方法,速率控制方法在流媒体网络传输中可取得更好的效果。
探讨了核Fisher判决分析算法(KernelFisherDiscriminantAnalysis,KFDA),并提出了一种基于KFDA的高性能多类分类算法。在进行多类分类时,首先通过一个非线性映射将训练样本映射到一个高维的核空间中,建立一个KFDA子空间,在该高维空间中,不同类别的样本之间的差异增大,同类样本聚集在一起,因此,在这个高维核空间中,就可以利用简单的最近邻法进行多类分类。实验结果表明