社会网络中的消息排序研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ttmm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络是近年来快速发展的社会实时新媒体,它日益影响着人们的生活和学习,帮助人们更好的进行信息的交流和分享。在社会网络上,存在着一些非常活跃的用户,他们关注了成百甚至上千的其他用户。而网络快速的信息流极易造成信息过载,用户无法在订阅的大量消息中找到自己感兴趣的信息。本文针对这一问题,利用排序学习算法建立用户偏好模型,对新数据按分值大小进行排序。   首先,针对数据稀疏性问题,本文提出利用用户朋友的数据进行解决的思路。对不同的朋友,用户与他/她的亲密度不同,该朋友数据的重要性不同。本文使用用户相似性度量不同数据重要性的方法,并通过分析目标用户与其关注的朋友之间的各种关系以及文本相似度等信息计算相似性。本文首先利用RankingSVM对社会网络中的消息进行排序,并对加入朋友样本进行训练的方法进行了验证,实验结果表明了算法的有效性。另外,为了提高模型的效率,我们使用RankBoost算法对消息进行排序,修改损失函数反映不同数据集的重要性,实验结果表明RankBoost算法效率高且能应用于实际。   其次,为了训练模型,我们抽取了样本的多种特征,包括消息文本特征、消息作者自身的特征、目标用户跟消息作者之间的关系等特征。另外,针对社会网络消息文本短小的问题,我们在使用TF-IDF的基础上,增加了利用LDA抽取的文本主题特征。在用户的相似度计算上,本文最大程度的利用了社会网络的各种信息,提出利用文本相似度、社会关系相似度、交互的频率等多种信息计算用户相似性。   最后,在国内微博数据上对本文的相关算法进行了测试,实验结果表明了算法的有效性。
其他文献
随着科学技术的快速发展,越来越多的企业或单位开始利用虚拟机搭建数据中心来应对日益增长的计算需求。然而,随着数据中心虚拟机数目的不断增加,单个虚拟机发生故障从而导致整个
视觉物体表示(visual object representation)是联系底层图像信息和高层语义概念之间的纽带,在物体识别、图像检索等计算机视觉任务中起着关键性的作用。基于鲁棒性局部图像特
在现在的经济社会中,大量的商品和服务的支付都需要使用银行交易业务。银行系统在金融机构中的作用越来越重要,这直接关系到金融机构的盈利和为其客户提供便利服务。世界银行
随着互联网的发展,大数据时代悄无声息地走到了我们身旁,每天用户各种各样的行为产生了数以亿计的数据,这其中就包括了社交信息,购物信息以及浏览信息等。大量数据中包含着很
随着高速铁路的快速发展,高速移动通信网络成为高速铁路信息化建设的重要方向之一。高铁移动通信网主要分为铁路专网和用户开放式网络。本文根据特定的用户开放式高铁移动通
现在移动手机的使用已经在我们日常生活中广泛地传播,我们利用移动手机作为照相机,收音机,随身听以及浏览网络的工具。由于大部分的网页是为桌面计算机设计的,很难用小的屏幕设备
支持向量机是在统计学理论基础上发展起来的一种新型学习算法,已在机器学习、模式识别等领域取得了较好的应用效果,然而随着训练数据集规模的不断增大,支持向量机也表现出学习效
三线性分解算法因能对复杂多组分体系中的各组分同时进行定量分析而在众多领域得到应用。然而在嵌入式环境下,该算法因平台优化不足而性能不佳。三线性分解算法计算复杂,如何
近年来,随着云计算技术的广泛应用,数据中心网络的规模不断扩大。数据中心网络的路由方法作为影响数据中心各项性能指标的重要因素之一,一直是相关研究中的热点问题。目前,数
在移动Ad Hoc网络(Mobile Ad Hoc Network,MANET)中,节点的移动特性将直接影响网络性能。因此构建一个真实、合理的移动模型以仿真节点在实际场景中的运动过程是研究MANET的重要