消重相关论文
本文在对现有主流网页消重技术进行分析基础上,针对元搜索引擎技术,提出一种基于元搜索的网页消重算法。介绍了算法的具体实现步骤......
文本消重是搜索引擎中的一项重要技术,能将搜集到的网页中的近似镜像网页去掉,而后再建索引提供服务,这样用户查询时就不会出现大量内......
现代大型门户信息系统普遍具有数据类型繁多。系统结构复杂等特点.这一系列特点都给系统的统一检索带来了困难。而大型企业的门户信......
本文详细的介绍一种基于Web搜索引擎技术的网络敏感信息检索系统的设计与实现。基于搜索引擎技术的信息检索融合了文本挖掘的思想,......
在对网络藏语文本做信息抽取时,往往由于有很多藏族人具有同一个名字,使研究人员得不到期望的结果。为了解决这种"信息丢失问题",本......
针对海量网页信息,提出适于搜索引擎使用的网页相似度处理算法。算法依据网页抽象形成的概念,在倒排文档基础上建立相似度处理模型......