基于陷阱技术的网络爬虫检测

来源 :计算机应用 | 被引量 : 12次 | 上传用户:smiletonyfrank
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络爬虫作为一种网络资源获取程序,在被搜索引擎等领域广泛应用的同时,也带来隐私泄露、版权纠纷等诸多问题,因此需要检测和约束Spider的行为。总结了现有的Spider检测方法,介绍了陷阱技术在Spider检测中的应用现状,提出利用有结构的陷阱技术,构建Spider检测的网站模型和相应的检测算法,并对该方法的检测能力进行了分析和评价,最后在通过实验系统验证陷阱检测方法与人工分析结论相一致的基础上进一步分析了该检测结果的成因。
其他文献
据新华网报道,国务院《关于进一步推进户籍制度改革的意见》明确提出,要将进城落户农民完全纳入城镇住房保障体系。现在,很多农民已经进城打工,但是没有获得户口,怎么保证他们在城
为了快速有效地进行步态识别,利用特征关系非平稳分布的统计特性,提出了一种新的基于特征关系表述的步态识别算法。首先,将剪影轮廓相邻像素点间8邻域相对方向标号作为特征关系属性一,将轮廓边界点与中心点间的距离作为特征关系属性二,经直方图归一化处理,得到两种关系属性的联合概率;其次,结合主成分分析(PCA)降维的方法,提取特征主向量;最后,采用最近邻分类器进行识别分类。实验证明,该算法在CASIA步态数据
提出了一种改进的基于灰度投影的像移矢量估计算法。根据相关曲线的特性,针对全局搜索法和三点搜索法的不足,该算法在搜索第一步时保留多个参考点,并逐步递减,既能解决全局搜索法运算量大、耗时长的问题,又能避免三点搜索法出现误匹配的现象。仿真实验表明,该方法在保证像移矢量估计精度的同时,提高了运算速度,具有较好的效果。
针对网格环境的动态性特征,提出了一种可靠的网格作业调度机制(DGJS)。按照作业完成时间期限,DGJS将作业分为:高QoS级、低QoS级和无QoS级,不同QoS级作业有不同的调度优先权;基于资源可用性预测,DGJS采用基于可靠性代价的作业调度策略,将作业尽可能调度到可靠性高的资源节点;另外,DGJS对不同QoS级作业采用不同的容错策略,在保证故障容错的同时,节省网格资源。实验表明:在动态的网格环境
传统的行为模式分类一般是基于问卷调查的方式来实现,但存在数据的可靠性和采集的困难等问题。提出一种基于GPS记录数据建立人的三种行为模式的分类方法,通过时间、速度和方
企业在管理实践中,往往由于缺乏远见与策略思考,在操作上不得要领,经常陷入窘境与误区,最终导致与大客户关系的"亚健康"状态,市场位势与品牌提升缓慢,形成企业成长的瓶颈。俗
期刊
ATP敏感性钾通道将细胞膜电活动与细胞代谢联系在一起的重要通道.KATP通道是多种疾病的一个治疗学靶点,尤其对心肌细胞的保护作用,在心脏疾病的治疗上有重要意义.近几年研究使得对KATP通道有了更深入的了解.因此本文就豚鼠心肌细胞KATP通道的功能和影响因素做一综述.
为了获得更好的分割效果,成功地将局部二值模式(LBP)纹理模型和灰度特征纳入到合作型协同进化算法(Co-CEA)框架中,并实现了图像分割。该方法首先分别对LBP纹理模型和灰度特征进行编码,然后运用Co-CEA进行进化操作,最后通过本文提出的联合适应度函数确定分割区域。实验结果表明该方法在分割质量上效果明显,并有效地降低了时间复杂度。
【摘 要】 目的:探讨中药房药师开展优质的中药学服务的有效途径。方法:制定详细的中药学服务规程和管理制度,并对中药房药师展开能力培训。按照规程给患者提供优质的中药学服务。设计调查问卷,通过调查问卷的形式来调查中药房药师服务规程和管理制度实施前后患者对中药学服务的满意度。结果:根据调查问卷的统计结果,患者对中药房药师的中药学服务的满意度为92.50%,与实施中药学服务规程和管理制度之前相比具有显著的
山东省菏泽市某村村民何某来信咨询:2006年春,我因外出与同村韩某签订协议,将村里于1998年发包给我与老伴、承包期为30年的3.6亩耕地转包给韩某,期限20年。韩某让我将这块3.6亩土地