基于Maze平台的Trust--Based推荐模型的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:helloclare
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机科学技术的发展和互联网应用的普及已经将人类社会带入了信息化的时代。信息化时代的到来在给我们的工作、学习和生活带来无限便利的同时也引发了一些问题。这其中“信息过载”现象就是伴随着互联网应用技术的发展而产生的一个较为突出的一个问题。随着互联网上信息量的爆炸式的增长,对于互联网用户而言,从海量多样的信息集合中快速准确地找到自己需要的信息变成了一件极具挑战甚至不可能完成的任务。推荐技术和推荐系统正是在这样的背景下应运而生。推荐系统的目的就是应用机器学习和数据挖掘的手段对互联网用户个性化的兴趣需求进行建模,并以此为依据增量式的为用户对互联网上动态变化的数据内容进行过滤操作,找到匹配用户兴趣需求的信息内容推荐给用户[1]。目前比较常见的推荐技术主要有协同过滤算法、基于内容的推荐算法、基于知识库的推荐算法和混合模型推荐算法。但是在web2.0时代随着社会化网络在互联网上的兴起,互联网的发展逐步向社区化的方向迈进。与此同时人们通过互联网获取信息的过程也体现出一定的社会化特征,推荐技术为了适应这样的变化开始将挖掘互联网用户节点间的社交规律引入其研究范畴,作为提升个性化推荐系统服务质量的新突破点。  本文基于Maze网络文件共享系统的实际应用环境,在推荐算法的设计中引入了信任机制的概念,并以此展开研究工作提出了一种trust-based推荐算法。该算法首先通过挖掘Maze系统日志服务器收集到的用户下载日志以及好友关系日志,发现隐含在Maze系统资源下载关系及好友关系中反映用户节点间信任关系的“社交规律”,并利用数据挖掘和机器学习的手段建立trust-net模型去表示这种社交规律。在此基础上应用己建立trust-net社交模型,结合推荐领域较为成熟的协同过滤算法的运行原理来模拟用户在Maze网络文件系统中搜寻感兴趣的目标资源的过程,为Maze系统中的用户计算出个性化的资源推荐结果。为了对trust-based推荐算法的推荐效果进行评测,我们将Maze系统日志服务器收集到的8个月的日志信息作为总数据集。将其按照一定的比例划分为训练集和测试集,分别作为该推荐算法的输入数据和评测样本,从推荐结果的召回率方面对算法的性能进行评测和调优。
其他文献
众所周知,地理问题分析与求解是一个非常复杂的过程。而将分析出的地理模型实现成可运行的程序更是一项庞大的工程,需要消耗很多的人力和财力。当前现状是,大量实用地理模型己被
失语症形成的原因有多种多样,脑卒中等神经疾病是导致言语缺失最常见的原因。由脑卒中引起失语症可以通过言语康复训练进行恢复,从而提高他们的交流能力,让他们更好的融入生活。
音乐情感分类在音乐检索和音乐推荐等方面具有广泛的应用。国内主流的搜索引擎百度(Baidu)和门户网站网易(163)都相继推出了音乐情感检索系统,但检索的准确率都不高。以往的
船舶自动识别系统(Automatic Identification System,简称AIS),是新一代的海上通信导航系统,能够实现船舶、船岸间的船舶表示、位置、航向、航速等航行信息的自动交换。随着船舶自
作为许多数值模拟的前处理过程,网格生成过程很大程度上影响着求解的效率和正确性。非结构网格由于其对复杂外形的良好适应性,正逐渐成为诸如计算流体力学(CFD: Computational
随着互联网的发展,针对每一个用户提供不同的个性化服务的推荐系统已经深入到互联网的各个领域。本文对推荐系统的国内外研究和应用现状进行了调研,然后提出了一个推荐系统框
本文采用人工生命的方法来研究蜂群复杂的行为。首先,在对蜜蜂个体的行为进行分析和归纳的基础上,建立了蜜蜂的感知模型、环境模型、移动规则、觅食规则、避障规则、记忆规则
随着计算机应用的快速发展和普及,现代软件逐渐呈现出规模越来越大、复杂性越来越高、生命周期越来越紧、功能要求越来越强等特征,这也从客观上要求必须提高软件的可扩展性。近
随着互联网以及Web技术的快速发展,Web应用成为重要的信息获取和交流平台。应用开发者希望应用能在各种主流的浏览器平台上表现一致,但由于浏览器实现技术的差异以及对标准支持
本文研究历史网页文档与股票市场行为的相关性,并建立预测模型来深入分析和定量评估网页文档在股票市场预测中的作用和效果。通过中国网络信息博物馆(Web Infomall[1])的历史