面向不同对象的搜索引擎中的排序模型与性能评价

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:GWstars
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,互联网规模不断扩大,成为人们最重要的信息来源之一,但同时也出现了“信息过载”的问题,网络上的信息增长速度过快,用户获取所需信息难度越来越大。因此,搜索引擎应运而生。随着搜索引擎的发展,目前有两个重要的研究方向:其一,传统搜索引擎是基于网页的,而网络上的信息承载方式已经不仅限于传统网页,因此需要探索新的搜索引擎技术;其二,搜索引擎层出不穷,质量参差不齐,需要有一种合适的方式来评价搜索引擎的性能。本文主要贡献有以下三点:第一,提出了一种新的对象级别搜索引擎的排序模型。本模型适用于多种对象存在的场合,是基于对象之间的链接关系的,从而具有通用性。第二,提出了UIG的概念。UIG与传统的DCG相比,衡量的信息更为准确。第三,提出了一种用于搜索引擎性能评价的搜索引擎的理想点击分布族。在实际应用中,可以通过搜索引擎的实际点击数据拟合其参数;同时,从实际点击分布与理想点击分布的差别上,可以反映出搜索引擎排序算法的缺陷与改进方向。本文所提出的对象级搜索引擎排序模型,首先以对象链接图为基础,计算单个对象对单个term的相关度,然后对多个term的相关度进行合并。本模型在ACM Portal数据集上得到验证取得较好效果。本文所提出的搜索引擎点击分布模型,是从寿命分布中的威布尔分布出发,并结合搜索引擎的特点加以修改所得。本模型在AOL、搜狗、微软搜索引擎数据集上得到验证取得较好效果。
其他文献
随着各地区电处理种子试验和推广工作的开展,对于电处理增产机理的研究就更加成为迫切的要求。为此,近两年来,我们先后播种了各小麦、大麦、玉米、棉花等经过电处理的种子,
软件测试是保证软件质量的重要手段,其中测试数据的自动生成则是测试阶段最关键的技术。近年来广泛应用的面向对象(OO)技术,在提高了代码重用性和增强程序灵活性的同时,由于
视频会议作为多媒体应用的一个重要组成部分,为身处两地的用户提供了直接、全面的沟通途径,为社会性的信息交流发挥了巨大的作用。在过去几十年时间里,视频会议系统不断发展,
集成电路(Integrated Circuit,IC)测试是保障集成电路安全可靠工作的一个必要环节。随着制造工艺的进步,电路规模不断扩大,单个芯片中集成的晶体管数量急剧增加,这使得测试芯片所
著名数学家波利亚说过:掌握数学就意味着善于解题.解题永远是数学学习中的主要活动.那么,如何快速有效地提高数学解题能力,提高数学素养呢?笔者结合多年的教学经历和体会,发
本文设计了用于轻型臂机器人关节的位置伺服系统,提出了一种全数字化的基于电机矢量控制算法的伺服系统控制器的硬件设计方案,并在一片现场可编程门阵列(FPGA)中该方案得到了
随着因特网的普及和IP技术、VoIP技术的发展,VoIP产品在电信市场中占有的份额不断提高,VoIP技术已经成为计算机业和电信业最热门的话题之一。SIP协议具有简单、灵活和可扩展
新课程标准中明确指出“教师要创设适当的问题情境,鼓励学生发现数学规律和问题解决途径”.可见创设问题情境在学生学习知识过程中的重要性.那么,问题情境如何创设?意义又有
With a small number of snapshots, performances of uniform circular array(UCA) root-MUSIC based methods for directionof-arrival(DOA) estimation suffer serious de
一、问题提出rn文献[1]就“把关题”的命制从如何把数学思想方法合理地渗透在试题中进行了鉴赏和思考,文献[2]给出了在高考复习中,“把关题”的解题教学该如何展开的一种比较