基于陷阱技术的网络爬虫检测

来源 :计算机应用 | 被引量 : 12次 | 上传用户:smiletonyfrank
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络爬虫作为一种网络资源获取程序,在被搜索引擎等领域广泛应用的同时,也带来隐私泄露、版权纠纷等诸多问题,因此需要检测和约束Spider的行为。总结了现有的Spider检测方法,介绍了陷阱技术在Spider检测中的应用现状,提出利用有结构的陷阱技术,构建Spider检测的网站模型和相应的检测算法,并对该方法的检测能力进行了分析和评价,最后在通过实验系统验证陷阱检测方法与人工分析结论相一致的基础上进一步分析了该检测结果的成因。
其他文献
为了快速有效地进行步态识别,利用特征关系非平稳分布的统计特性,提出了一种新的基于特征关系表述的步态识别算法。首先,将剪影轮廓相邻像素点间8邻域相对方向标号作为特征关系属性一,将轮廓边界点与中心点间的距离作为特征关系属性二,经直方图归一化处理,得到两种关系属性的联合概率;其次,结合主成分分析(PCA)降维的方法,提取特征主向量;最后,采用最近邻分类器进行识别分类。实验证明,该算法在CASIA步态数据
提出了一种改进的基于灰度投影的像移矢量估计算法。根据相关曲线的特性,针对全局搜索法和三点搜索法的不足,该算法在搜索第一步时保留多个参考点,并逐步递减,既能解决全局搜索法运算量大、耗时长的问题,又能避免三点搜索法出现误匹配的现象。仿真实验表明,该方法在保证像移矢量估计精度的同时,提高了运算速度,具有较好的效果。
针对网格环境的动态性特征,提出了一种可靠的网格作业调度机制(DGJS)。按照作业完成时间期限,DGJS将作业分为:高QoS级、低QoS级和无QoS级,不同QoS级作业有不同的调度优先权;基于资源可用性预测,DGJS采用基于可靠性代价的作业调度策略,将作业尽可能调度到可靠性高的资源节点;另外,DGJS对不同QoS级作业采用不同的容错策略,在保证故障容错的同时,节省网格资源。实验表明:在动态的网格环境
为了获得更好的分割效果,成功地将局部二值模式(LBP)纹理模型和灰度特征纳入到合作型协同进化算法(Co-CEA)框架中,并实现了图像分割。该方法首先分别对LBP纹理模型和灰度特征进行编码,然后运用Co-CEA进行进化操作,最后通过本文提出的联合适应度函数确定分割区域。实验结果表明该方法在分割质量上效果明显,并有效地降低了时间复杂度。
【摘 要】 目的:探讨中药房药师开展优质的中药学服务的有效途径。方法:制定详细的中药学服务规程和管理制度,并对中药房药师展开能力培训。按照规程给患者提供优质的中药学服务。设计调查问卷,通过调查问卷的形式来调查中药房药师服务规程和管理制度实施前后患者对中药学服务的满意度。结果:根据调查问卷的统计结果,患者对中药房药师的中药学服务的满意度为92.50%,与实施中药学服务规程和管理制度之前相比具有显著的