URL聚类相关论文
该文所要讨论的基于用法的网站个性化就属于网站个性化的一个分支,它通过对网站日志中的url进行聚类,在原有的网页基础上作少许静......
综合运用URL聚类、JavaScript脚本解释等技术,自动识别和提取职位列表页中的职位及翻页链接.实验证明上述技术是行之有效的.......
垂直爬虫程序无法直接移植到其他网站并且程序设计需要大量人工干预。为此,提出一种高可移植性的通用型垂直爬虫设计方法。自动识......
由于互联网的高速发展和普及,互联网已经成为了一个十分重要的信息源。而许多互联网用户也越来越迫切的希望能够在浩瀚的互联网中......
网页自动分类是当前互联网搜索领域一个热点研究课题,目前主要有基于网页文本内容的分类和基于网页间超链接结构的分类。但是这些......
Web2.0技术在互联网上的出现以及社交平台的兴起,极大的促进了动态网页的使用和普及。动态网页中的Ajax技术,实现了客户端和服务端之......
快速高效地获取网页主题信息的需求使得Web信息抽取技术成为信息技术领域的研究热点。现有的Web信息抽取技术大致可以归纳为基于统......