Web网站死链检测方法

来源 :微电子学与计算机 | 被引量 : 0次 | 上传用户:candyyao007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网站作为大规模的信息集合体,包含了大量的Web链接.有些Web链接经过一段时间之后,因种种原因而失效或者出现错误,从而形成死链.本文提出一种Web网站死链检测方法.根据Web链接的调度过程,自动获取网站链接信息;根据Web链接的结构特点和网页检索操作,对死链进行分析和检测;针对链接的相互引用问题和用户体验与页面深度的关系,对采集的数据进行预处理.实验结果表明,该方法能有效地提高死链的检测覆盖率和处理效率.
其他文献
提出了一种具有阶梯浅沟槽隔离结构的LDMOS.阶梯浅沟槽结构增加了漂移区的有效长度,改善了表面电场及电流的分布,从而提高了器件的击穿电压.借助器件模拟软件Silvaco对沟槽深
设计了一种兼容AMBA2.0AHB总线的实时高效存储管理IP——静态存储管理IP.与虚拟存储管理技术相比,IP可以为实时系统芯片的高实时性提供良好的保障,它完成一次存储器访问最多
提出的基于匹配滤波的位同步算法有效利用了这种信号结构,可以显著提高位同步的灵敏度.仿真结果表明,以NH(20)次码信号结构的信号为例,采用2s的位同步时间,在错误位同步概率为1
提出一种混合网络中节点密度自适应的路由协议,能够实现全网各条道路上实时车流的估算,并根据节点密度自适应地选择WiMAX或WAVE网络发送数据包,同时动态生成数据包转发的源路