网页排序算法相关论文
判断一个搜索引擎的成功与否,用户对搜索结果的满意度起了关键作用。由于通用搜索引擎搜索到的内容数量过多,且相关率低、重复率高......
针对通用搜索引擎在专业信息检索方面效果不佳的问题,提出了一种基于Lucene和Nutch组件的纺织服装专业领域专业信息检索系统架构,......
Internet和Web的迅猛发展和普及,把人们带入了一个新的信息时代,同时Web智能也吸引了愈来愈多的关注和研究热情.该文对Web智能的几......
该文针对基于内容的个性化方法的各个环节提出了一系列数学模型,包括:度量用户查询词含义的数学模型、对用户查询词进行有效扩展......
在互联网技术飞速发展的今天,搜索引擎已经成为人们生活中必不可少的一部分。各式搜索引擎已经成为在信息过载的互联网中搜寻信息的......
伴随着互联网信息爆炸式的增长,海量数据不断产生,人们在网络上查找所需文学作品的效率越来越低。并且随着文学在互联网中的高速传......
当今随着信息技术的日新月异,快速发展,人们对信息的渴望也是与日俱增。面对杂乱的海量数据,如何能从中快速得到用户想要的信息,是当前......
随着互联网上信息的暴增,用户很难在互联网上查找到自己想要的信息。为了解决此问题。搜索引擎诞生了。同时经专家统计发现,人们在......
在过去的几年中,随着互联网的高速发展,搜索引擎的作用与日俱增,越来越多的互联网用户开始选择搜索引擎作为其获得网络资源的首选......
互联网的飞速发展使得信息以前所未有的速度产生和传播,面对信息呈指数式增长、垃圾信息泛滥成灾的困境,搜索引擎如何找到对用户真正......
随着互联网及移动互联网技术的不断发展,一方面是用户和互联网交互的程度不断加深,越来越多的用户反馈了相当多的数据,可以从中洞......
Web Spam是一种不考虑网页的真正价值,却有意实施不公正的相关性或重要性的排名行为。它的出现不但威胁到搜索引擎的公正排名,同时还......
当前常用的信息检索技术主要还是基于关键词进行机械匹配,将研究的重点放在算法的优化上,而忽视了语义方面的研究。这不能从根本上解......
随着web技术的发展,好的网页排序算法越来越重要。本文主要讨论了网页排序应当考虑的因素如网页更新时间等。在对这些因素进行分析......
PageRank算法是著名的通用搜索引擎的wcb页面排序算法,但对具体主题的信息检索,却存在主题漂移的问题。本文从改进计算模型的传递概......
随着Internet的广泛应用和飞速发展,为了从海量的资源中搜索出自己想要的信息,人们不得不大量的依靠着搜索引擎,即信息检索技术来提供......
PageRank算法是网页排序的经典算法,在链接网络领域已得到广泛的应用。主题是文献网络中不可忽略的重要元素,于是在对文献评价算法的......
随着互联网的广泛使用、信息技术的快速发展,网络给用户带来了大量的信息.在这个浩瀚的信息世界里在短时间内获得对自己有用的信息显......
伴随着垂直搜索引擎领域的全面发展,为了满足人们对搜索引擎系统的高质量需求,通过深入剖析了Google经典的PageRank算法,针对其单纯的......
对改进后的Lucene网页排序算法中考虑的几个因素,用模糊层次分析法的方法对这些因素的权重进行确定,并运用算例对其过程进行说明,使权......
随着web技术的发展,好的网页排序算法越来越重要.本文主要讨论了网页排序应当考虑的因素如网页更新时间等.在对这些因素进行分析之......
介绍了笔者所设计的一个校园网搜索引擎(SzCompass)中的网页排序算法。首先详细分析了通用搜索引擎常用的PageRank和HITS网页排序算......
根据网页点击信息改进了原有的PageRank算法, 利用Seidel迭代算法加快了迭代收敛过程. 实验结果表明, 改进后的迭代算法效率提高23......
税务领域业务背景复杂,办税系统层级较深不便记忆和查找、信息政策多样导致信息检索不便;现有通用搜索引擎搜索结果数量多、查准率......
Web中海量信息源的组织是异构的、多元的和分布的,这给信息检索系统提出了巨大的挑战.本文结合本体论和个性化搜索引擎技术,以现有搜......
传统的网页排序算法有多种,比如PageRank算法、HITS算法等,这些算法虽然在评价网页权威性方面体现出一定的优势,但也存在不足,要么......
网页排序算法对根据用户查询词搜索到的大量页面进行排序,从而返回给用户,因此排序算法对搜索引擎的好坏起着关键作用。Nutch搜索......
系统地研究了Web信息检索常用排序算法,即基于Web页面内容的排序算法、基于Web页面链接分析的排序算法和基于检索用户的排序算法,......
针对现有算法在计算道路网节点重要度时忽略节点间的相互影响以及道路密度引起的重要度异常等问题,提出了一种基于加权网页排序算......
为研究情感词对情感倾向分析的作用,提高微博情感分析性能,提出一种情感词图模型的方法,利用PageRank算法计算出情感词的褒贬权值,......
针对Hadoop分布式文件系统在航空货运中海量小文件存储方面存在的低效率问题,提出一种面向航空货运中海量小文件的存储优化方法。......
为了满足搜索引擎系统日益增长的高质量检索需求,针对Nutch搜索引擎框架没有实现Google的PageRank网页排序算法,分析了PageRank算法,......
在分析现有的词频位置加权排序法、Direct Hit算法、PageRank算法和Lucene的网页排序算法后,将这三种著名的算法思想运用到Lucene的......