网页查重相关论文
网页查重就是将大量网页集合中重复的网页找出来,并加以选择,使用户不用处理大规模重复信息,在节省时间的同时,提高信息检索等的应......
随着互联网的日益普及和迅猛发展,网络上的信息量呈现爆炸式的增长,搜索引擎成为人们获取信息的主要方式,而且越来越受到重视。重......
当今中国,随着互联网的普及和网络终端的高速发展,网络已经深入到了人们生活的方方面面。面对海量的网络信息,搜索引擎的出现极大的方......
网页查重技术是浏览获取有用信息的关键技术,传统的查重方法中,选取关键词在网页中出现的频率来判断网页是否重复,如果关键词相近,可能......
介绍了处理网页排重的三类通用方法,并介绍了在企业数据仓库系统中,通过利用相似性检索技术实现情报资料自动排重的应用。通过对测......
研究网页查重问题。针对传统的SCAM网页查重算法根据比较几个关键词网页中出现次数来判断网页是否重复,当网站中存在相似网页时,由......
随着网络信息爆炸式增长,人们对信息检索有了更高的要求。在海量的网页中,有很多重复的网页。网页查重可以节省网络带宽,降低存储......