url聚类相关论文
该文所要讨论的基于用法的网站个性化就属于网站个性化的一个分支,它通过对网站日志中的url进行聚类,在原有的网页基础上作少许静......
目的:大多数残疾人士上网都会遇到各种障碍。为减少上网障碍,对网站进行无障碍检测评估是十分必要的。鉴于大部分网站具有海量网页......
综合运用URL聚类、JavaScript脚本解释等技术,自动识别和提取职位列表页中的职位及翻页链接.实验证明上述技术是行之有效的.......
垂直爬虫程序无法直接移植到其他网站并且程序设计需要大量人工干预。为此,提出一种高可移植性的通用型垂直爬虫设计方法。自动识......
随着互联网技术的高速发展,网络已经深入到人们生活的各个方面,同时由于互联网信息量的爆炸式增长,越来越多的网站运营商开始重视......
网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容的分类和基于网页间超链接结构的分类。但是这些......
Web2.0技术在互联网上的出现以及社交平台的兴起,极大的促进了动态网页的使用和普及。动态网页中的Ajax技术,实现了客户端和服务端之......
快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统......