基于用户反馈的搜索结果排序技术研究

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:ttgxa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的发展,网络上的信息量不断增加,为了让人们能够方便地从海量信息中获得所需信息,搜索引擎技术应运而生并不断发展壮大。人们开始探寻各种各样的排序算法,意图把与用户查询最相关的结果排在搜索结果最前面返回给用户。但是目前,网页信息的表达形式都十分简单,用户描述查询的形式更是十分简单,这就造成了在判断网页内容与用户查询相关性时十分困难。 本文首先对现有的搜索引擎排序算法进行了分类总结,分析它们的优缺点。然后提出了一种基于用户反馈的新方法。该方法提出了一种网页语义标记的新思想,所谓网页的语义标记就是用来描述网页信息类别的词语,这些词语来源于网络用户的反馈,是用户在查看了网页之后,对网页所打的标注,所以这些网页标记能够比较准确地描述网页信息内容。 在网页标记的基础上,使用查询词+网页标记的查询表达方式,进一步更清楚地描述用户真实查询意图,并提出了基于标记信息的搜索结果排序方法,并针对该方法实现一个搜索引擎原型系统,最后采用多种评估方法与Google搜索结果进行对比分析,实验结果表明本文所提出的网页的语义标记确实能够更好地描述网页内容,利用网页标记所得到的排序结果比Google的排序结果更接近用户需求。
其他文献
随着Web服务的流行,Web服务的数量与日俱增,往往有多个Web服务满足同一功能请求,但是如何从众多服务中选择质量符合要求的服务,现有基于功能性描述的Web服务发现方法难以解决
微粒群算法是一种新型的、基于迭代的进化计算方法。自上世纪九十年代出现以来,由于其具有较少的参数调整以及算法简单易实现等优点,获得了国内外学者的关注和研究,它和遗传
数据挖掘是数据库研究、开发和应用最活跃的分支之一,也是决策支持系统的关键因素,它主要由数据库技术、数据可视化、统计学、信息检索、人工智能、机器学习和高性能计算等组
数据挖掘技术(Data Mining Technology)是伴随着数据仓库与在线分析处理(On-Line Analysis Processing, OLAP)这两项技术的快速起飞与应用,带来数据量与决策需求两方面持续增
使用图形处理器进行通用计算是高性能计算的一个新的发展方向。Nvidia的CUDA计算技术在图形处理器上提供了一个统一的开发平台,并成为目前应用最广的一个标准。CUDA平台包含程
随着现代社会对安全的要求不断提高,利用生物特征进行快速准确的身份识别成了当今的主流。步态是一种远距离可采集的生物特征,步态识别技术以其对系统分辨率要求低、信息采集
随着通信和计算机技术的不断进步,人们已经不再满足于通过有线途径传输数据,在某些场合下更期望能在无线的条件下实现数据传输。本文旨在研究并实现无线局域网范围内视频数据
随着软件行业的发展,软件的规模越来越大,复杂度也越来越高,为了保证软件的质量,软件测试在软件开发过程中重要性越来越大,软件测试也花费越来越多的人力、物力以及时间。在
在移动终端电池能量有限的无线Ad Hoc网络中,设计一个能量有效的延长网路生存时间的节能路由协议已经成为当前研究的重点和热点。目前提出的节能协议大都基于理想的无线信道
基于文字计算的群组决策是模糊决策研究中的一个重要方面,是现代决策科学的一个重要研究领域,其理论和方法在方案实施、城市规划、经济管理、金融投资、工程评价和军事决策等