多视角微博搜索算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:magiciany
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0及其相关的典型应用Blog、Microblog、SNS、Wiki、RSS等的发展,用户成为信息制造和利用的中心,他们拥有了更多传递信息的渠道。这种发展和变化不仅带来了互联网产业的升级,也给传统的网络信息检索方式带来了巨大的挑战。特别是近几年来,以Twitter为代表的微博的日益普及,使得实时搜索成为目前信息检索领域中的焦点之一。  本文以微博搜索的排名算法为研究重点,主要包括以下几个方面的内容:  1.以Web2.0环境下网络信息检索为背景,分析了Web2.0模式下的互联网应用的特点,介绍了微博等新型社交网络的出现所带来的实时搜索需求,以及传统的基于搜索引擎的信息检索方法在微博搜索中面临的挑战;  2.以Twitter作为平台,研究了微博(Microblog)的社会网络方面的相关特征及其信息传播模式,总结出6种与微博作者的社会网络属性以及微博本身的特征相关的因素来衡量Twitter用户社会影响力,分别是:(1)用户发布的微博的数量(the number of total tweets a user posts);(2)关注者的数量(the number of totalfollowers a user has);(3)微博内容的长度(the length of a tweet a user posts);(4)微博中包含的链接(URL)数量(the number of URLs atweet contains);(5)微博中包含的转发(Retweet)数量(the number of retweets in a tweet);(6)微博中包含的提及他人(Mnetion)的数量(the number of mentions in a tweet)等。  3.根据上面总结的社会影响力因素,我们提出一些了针对Twitter搜索的排名算法。具体而言,我们首先介绍了与这6种影响力因素对应的排名方法,例如,TweetRank(TR),FollowerRank(FR),LengthRank(LR),URLRank(UR),RetweetRank(RT)和MentionRank(Melation)。同时,我们通过将其中几种社会影响力因素结合起来定义了一种综合排名算法,即多视角微博搜索排名算法MFR(Multi-FactorRank)。在此基础之上,我们采用了肯德尔(Kendall’sτ)相关分析来确定各种影响力因素的权值,提出了一种加权排名算法WMFR(WeightedMulti-FactorRank)。  4.利用数据集“Twitter Authority Based Search-User Preference JudgmentDataset”对以上提出的各种微博搜索排名算法的排名准确率(Ranking Accuracy)和Rank Order Difference(ROD)进行验证评估。  实验结果表明,本文提出的多视角微博搜索加权算法--WMFR,无论是准确率(Ranking Accuracy),还是排名顺序差异(Rank Order Difference,ROD),均优于其他的搜索排名算法,搜索质量得到了显著提高。  因此,本文提出的多视角微博搜索加权算法WMFR对于开发基于Twitter的个性化、智能化的实时搜索服务具有重要的借鉴意义。
其他文献
当前,移动机器人已经被广泛应用到了工业、航天、军事、服务等诸多领域。随着应用领域的拓展,人们对移动机器人的智能性要求也越来越高。由于视觉系统是最接近人类感知环境的
纯电动汽车的广泛应用不但可以有效地避免对环境的污染,而且能摆脱对石油等燃料的依赖,将是人类今后大力发展的交通工具。电动汽车的应用前景十分广阔,但目前针对其复合电源能量
语音识别搜索算法,或称解码算法,是语音识别系统的核心之一,直接决定系统的性能。它利用声学模型、语言模型及更高层的语法语义等知识,在由发音词典构成的搜索空间中寻找最优
模拟人脑思考以及信息处理机制的人工智能自出现以来,虽然取得了长足的进展,但是至今没有研制出类似于人类智能水平的智能系统。主要的原因在于对于人类大脑高级信息加工处理机
随着机器人和计算机技术的飞速发展,机器人仿真成为一个研究热点,而其中一个非常核心的技术就是碰撞模拟。在真实场景下,同一时刻同一区域内只可能存在一个对象,碰撞是自然发
随着科学技术的发展,最优化已成为控制理论中一个重要的研究课题。如何从一切可能的控制方案中找到最优方案是现代工业化生产过程中急需解决的难题。由于生产工艺和自动化水
本论文主要研究了闭环控制系统中调节阀粘滞故障的补偿问题。调节阀的粘滞故障是导致闭环控制系统产生振荡现象的主要原因之一。本论文假设闭环控制系统由PI控制器、一阶延迟
随着经济的发展监控管理系统的需求与日俱增,机场,博物馆,购物中心等都装有监控管理系统,但是在港口对船只的监控管理,尤其是针对小型港口内没有完整的配电系统的小型船只,还没有成
车道线识别与跟踪是智能车导航中的关键技术之一,基于机器视觉的车道线识别与跟踪已成为研究热点。本文针对快速路中不同视野(远视野和近视野)和不同车道类型(实线和虚线)的复
本文研究了工业生产过程中报警信号的两个问题,即报警信号的相关性分析、报警概率图的理论与实现。关于报警信号的相关性分析,论文首先比较了报警信号与过程信号,指出报警信