基于社交网络数据的个性化推荐研究

来源 :商 | 被引量 : 0次 | 上传用户:zibu365H356
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着移动技术的发展,社交网络已经成为互联网产品中的主体,而社交网络产生的大量关系数据可以被用来进行个性化推荐的研究。本文在社交网络数据和用户行为数据的基础之上,研究了基于社交网络的个性化推荐,提出了一种概念算法,该算法很好的模拟的现实社会中的好友推荐关系。
  关键词:社会化;个性化推荐;社交网络
  1.引言
  随着Web2.0的推进,社会化网络产品形式也越来越多,网民也越来越多的参与到网络活动当中,与此同时,移动互联网的高速发展,更推进了社会化网络产品的兴起和流行。同样,相关技术的快速发展,也使得社会化网络产品变得越来越先进,更方便用户的使用和满足用户的特殊需求。那么目前典型的社会化网络产品的代表有博客、SNS、网络书签以及微博等。
  目前互联网已进入大数据时代,大量的数据如何被充分的发掘和使用已成为一个主要议题,而社会化网络产生的产生的数据量是巨大的,这些大量的数据也可以被用来做个性化推荐研究,其原因在于基于社会化网络的推荐很好的模拟了现实社会中的推荐。现实社会中人们会信任自己朋友给出的推荐,权威机构尼尔森调查过影响用户相信某个推荐的因素,表明90%的用户愿意相信来自朋友的推荐,有70%的用户愿意相信网络商品的评价[1]。可见,好友的推荐能够增加用户对推荐结果的信任。
  关于社会化网络研究目前主要分为两大类,一类是用户行为的研究,表现在研究社会化网络中人际关系与人际传播[2],社会化网络服务中的信任扩张与控制以及社会化网络服务的病毒性营销传播等;另外一类是从技术入手分析社会化网络产品,该类主要研究了社会化网络的链接预测以及社会化网络的信息扩散等[3]。社会化网络的研究已成为热点,同样利用它来研究个性化推荐是可行的。本文选用社会化网络产品中社交网络作为切入点进行研究。
  2.社交网络数据介绍
  社交网络在中国社交网络已成为覆盖用户最广、传播影响最大、商业价值最高的Web2.0业务[4]。社交网络中用户之间的关系异常的复杂,想充分的利用好社交网络数据进行个性化推荐研究,首先是要分析注册网友之间的关系,目前大多使用图论进行描述。社交网络的形成是基于用户网的形式呈现的,不同的用户是网络中不同的节点。可以使用G(V,E,W)表示一个社交网络,V是用户集合,E表示边的集合,如果两个用户Vi和Vj拥有关系,就有一条边e(vi,vj),w表示权重,权重的大小可以根据需要研究需要进行不同的规范设定。
  根据目前社交网络的发展情况,有三种不同形式的社交网络数据:双向确认好友关系类型,这类的网络好友需要双方互认,否则不能成功组建好友关系,代表的有Facebook、人人网等,该形式的好友可以使用无向图来表示关系;第二类是单向关注类型,用户关注其他用户的同时不需要对方必须关注自己,可以根据自己兴趣喜好选择,代表有Twitter、新浪微博等,这种形式可以使用有向图表示关系;第三种是社区小组类型,用户之间没有明确的关系,但来至于同一个“社区”拥有某些相似的特征[5]。
  根据目前的发展情况,一些社交网络产品的运营商是提供数据接口的。同时,大多数的社交网络允许用户创建属于自己的页面,并且显式的展现好友之间的关系,利用这一点获取的数据是真实有效的,几乎不需要再进行二次过滤。这是目前利用社交网络数据进行相关研究的一大好处。
  3.基于邻域的社会化推荐算法
  与如何发掘用户之间的熟悉程度一样,发掘用户之间的兴趣相似度同样不是易事。在现实生活中,熟悉度很高的用户,兴趣相似度并非一定总是最高的,简单的来说,兄弟之间的熟悉度很高,但他们之间的兴趣相似度有可能很低。一种简单有效的发掘兴趣相似度的方法是遍历用户的喜欢商品列表,喜欢商品重合度越大,兴趣相似度也被认为最大。
  综上,在充分利用了社交网络和用户行为数据之后,本文给出了上述基于邻域的社会化推荐算法,该算法看起来不是很复杂,但是移植到计算机中实现是复杂的,主要是对用户的好友关系和用户行为数据分别进行遍历,用户很多的情况下,关系网就会变得异常的复杂,而为了更加真实的描述现实中好友之间的推荐关系,不得不遍历每位用户的行为数据,然后在out(u)集合中计算寻找熟悉度高和兴趣度高的用户,这个过程对服务器以及数据分析软件的要求都非常的高。
  4.推荐列表的产生
  通过算法遍历每位用户的好友关系网络,找到他的好友,再遍历每位好友的行为数据,找到熟悉度和兴趣相似度最高的用户,遍历这些好友的兴趣记录,形成推荐候选列表。该候选列表中的推荐信息是按照优先排序的,排序的依据是那些出现在多个好友兴趣记录的信息排在前面。紧接着是对该列表进行过滤,主要是过滤掉那些已存在用户兴趣列表中的推荐,过滤可以使用比较遍历过滤。最后,根据预定的推荐数量选择列表中TopN信息推荐给用户。
  5.总结
  本文研究了利用社会化网络的个性化推荐,以社交网络数据作为背景进行相关研究,在充分的利用了社交网络数据和用户行为数据的前提下,给出了一个完整的推荐算法,该算法模拟了现实社会中好友之间的关系,算法并不复杂,但是在计算机中实现还是相对复杂的,接下来的研究可以进一步优化它的实现。(作者单位:安徽理工大学经济与管理学院)
  参考文献:
  [1]http://www.nielsen.com/us/en/newswire/2009/global-advertising-consumers-trust-real-friends-and-virtual-strangers-the-most.html
  [2]张婷婷. 社会化网络中人际关系与人际传播研究[D].长沙:湖南大学,硕士学位论文,2012
  [3]王萍. 社会化网络的信息扩散研究[J]. 情报杂志,2009,28(10):39-42
  [4]《2013-2017年中国社交网络行业发展前景预测与投资机会分析报告》:前瞻产业研究院,2013
  [5]项亮. 推荐系统实践[M].北京:人民邮电出版社,2012
其他文献
【摘要】 目的 探讨实时三维超声成像技术在胎儿体表畸形诊断方面的临床价值。方法 应用二维及实时三维超声成像对410例胎儿进行产前超声检查,统计并比较两种诊断方法的总符合率及二维及三维图像提供的畸形部位、形态改变的准确性及直观性。结果 发现胎儿体表畸形30例。二维超声能肯定诊断并与产后诊断相符的有18处(60.0%),实时三维超声为26处(86.7%),二者比较有显著性差异(P28~30周后影响因素
【摘要】 目的 探讨血清癌抗原153(CA153)、组织多肽特异性抗原(TPS)和癌抗原125(CA125)联合检测对乳腺癌诊断的临床应用价值。方法 采用电化学发光法检测患者血清中CA153、TPS、CA125。结果 乳腺癌患者组血清三种标记物水平及阳性率均明显高于乳腺良性病变组和正常对照组(P<0.01),联合检测的敏感性和诊断准确性均比单项检测高。结论 联合检测血清中的CA153、TPS、CA
目的 观察艾迪注射液联合化疗在非小细胞肺癌患者中的临床疗效.方法 采用抽信封随机对照法将70例患者分为观察组和对照组,观察组在化疗的基础上加用艾迪注射液,治疗2个周期,观察患者临床症状、近期疗效、免疫功能、毒性反应.结果 观察组在改善临床症状、免疫功能CD4/CD8比值、NK细胞阳性率和减轻毒性反应差异有统计学意义(P<0.05);近期疗效观察组略高于对照组,差异无统计学意义(P>0.05).结论
急性心肌梗塞是内科常见的危重病,是在冠状动脉病变的基础上,发生冠状动脉供血急剧减少或中断而使相应心肌细胞持久而严重的缺血所致心肌坏死.临床上表现为剧烈的胸痛,心力衰
焦虑状态是冠心病最常合并的情感状态之一,持久存在的焦虑状态与冠心病的发展密切相关.有研究显示[1],冠心病患者合并焦虑症状的发病率高达44.69%.近年来,应用稳心颗粒治疗冠
目的 探讨AO重建钢板治疗锁骨骨折的疗效.方法 对2008年12月~2010年2月收治的36例锁骨骨折患者采用切开复位AO重建钢板内固定.结果 根据Neer评定标准,术后优良率100%.骨折在术
目的 探讨老年甲状腺功能亢进(甲亢)患者临床表现及甲状腺激素、血糖、血脂代谢特点,从而引出临床诊断及治疗的注意事项.方法 随机抽取甲亢Graves'病患者146例.根据年龄分为
藏医病因、病机学中病理、生理的特征俱离不开三因素及其20种特征,是整个生命活动的功能物质,它既有共性,又存在特异性,故调节三因之间的平衡是人体健康的保证,也是根本。
典型的小儿川崎病诊断不难,但不足一周岁的小儿多无颈淋巴结增大、皮疹.易误、漏诊.而患儿的某些症状,又与另一些病相混淆而误、漏诊,故应提高对本病的认识.
摘要:电子商务主要通过各类网络来进行相关的电子交易及服务活动。“云计算”技术的出现改变了传统的商务经济模式,为电子商务在金融领域的运用提供了便利。本文将以云计算作为切入点,详细分析在“云计算”环境下电子商务的安全性,并就电子商务在“云计算”环境下如何保证自身数据的安全性提出相关解决对策。  关键词:云计算;电子商务;安全;对策  全球信息化的发展为云计算技术带来了全新的发展之路,云计算技术现已广泛