基于P2P结构的分布式协同过滤系统研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lindashu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化电子商务推荐系统在过去几年得到迅速发展。许多大型的商业网站已经使用推荐系统为其客户推荐产品。例如Amazon、Ebay、淘宝等。这些推荐技术是网站个性化的一部分,它使网站自身适应每个用户的需求。推荐算法是推荐系统的核心。协同过滤算法是最常用的推荐算法。协同过滤推荐系统找出与用户兴趣相似的其他用户,通过其他用户的评分来预测用户的感兴趣的商品。但是,由于协同过滤算法存在扩展性等问题。算法的复杂度随着用户和项的数量的增加而急剧上升。因此,需要应用分布式协同过滤来解决这样的问题。 本文在一般协同过滤系统的研究基础上,利用分布式计算和JXTA实现了分布式协同过滤,其中有以下内容:(A)分布式计算。将中心化的数据库的数据分别分配到P2P网络中的对等体进行相似性运算,每个对等体负责计算一部分数据,然后每个对等体将计算的结果返回给分配任务的对等体。这个对等体将其他对等体返回的部分数据进行汇总。利用分布式计算可以有效减少计算项相似度的运算量,并且充分利用P2P网络中闲置的资源。(B)利用sun公司提出的P2P规范协议JXTA开发出一套P2P协同过滤系统。系统主要功能包括:⑴该系统充分利用JXTA的几个关键属性来实现数据传输与数据查询。如利用通告来建立接收信息的限制。利用JXTAserver socket用来监听信息,凡是不满足通告内容的数据都不会被系统接收等。⑵该系统属于完全分布式系统,每个对等点之间共同充当客户器与服务器的角色。数据库储存的数据是一些相似度很高的用户的评分数据,系统就是通过这些数据来对用户进行协同过滤推荐。⑶对等点储存部分的数据,这些数据是动态的,随时变动的。系统会将数据库里面相似度最低的用户数据作为阈值,进入对等体的数据相似值大于阈值,将会存入邻集数据库中。
其他文献
1971年,我们公社在东芦城大队4个生产队5.5亩水稻秧田中进行了土面增温剂育秧试验,获得初步成功。土面增温剂是一种含水的膏状化学物质,有效成分为30%,呈中性反应,对人、畜
冲压是汽车生产制造过程四大工艺中的重要一环。在冲压加工过程中,由于种种原因,会出现生产线被迫停止的状况,即停机问题,这导致了生产效率的降低以及成本的增加。员工在处理
北京出版社从女记者金凤同志三十多年来所写的通讯、特写中,收集了部分作品,编辑成通讯选集《时代的眼睛》,公开发行。 Beijing Press collected some works from the comm
我国的校园网大都在九十年代中后期建成,受当时资金和技术条件限制,节点少,带宽低,运行业务简单。随着各学校规模的不断扩大,需入网的节点迅速增加;现代化教学手段的运用,使
京丰5号来源:原编号69—407。系我所1963年以(台中39×水源三百粒)后代为母本,(农林29×农垦19)后代为父本杂交,1969年初步育成。特征特性:在北京地区作麦茬稻,一般 Jing F
近些年,随着国民经济的快速增长,工程项目的规模和复杂程度也日益增大。工期、成本、质量作为项目管理者关注的主要工程目标,三者的好坏直接影响工程项目的完成情况。由于三
“一旦女人结了婚,男人就佥对你不以为然,你理所当然地属于他。而我不需要由别人来安排我的生活。我自己的本能和信念告诉我该做什么,不该做什么,不管这些做法是对是错,但毕
“赶祁门,赛高桥,(茶场)亩产305斤”烘绿毛“;汗可流,力可尽,夏秋再堑一把动;亩产干茶一千斤,再派代表上北京”。这是湖南湘潭群丰社社员们对今年上半年“烘青绿毛”茶第三
随着经济的逐渐发展,我国的教育水平也在不断的提高,高等院校的体育文化的教育是高校校园文化的重要的一部分,对于高校学生体育锻炼的要求有利于促进学生的身心健康发展,促进
近年来,国内企业信息化建设逐步走向成熟,到现在为止很多行业都经过了20多年的信息化建设历程,取得了相当大的成效。但随着信息化的快速发展,“信息孤岛”日益严重。为解决“信息孤岛”问题,IT界先后提出了多种理论即解决方案。各种理论相互渗透、相互影响,很多应用者对此难以区分,无法选择合适的方法。随着电力事业改革的深入,电力系统逐渐进入商业化运营模式。在这种新的运营模式下,电力信息系统的集成将有助于各个电