面向多源社交网络的用户兴趣爱好特征分析与推荐技术研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:kmj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社交网络中,用户可以通过两种方式表现自己的兴趣爱好。第一种方式是在个人主页显式填写感兴趣的项目,第二种方式是通过发布和关注的内容间接地表达兴趣爱好。理解这两种方式,采集相应的网络数据,研究人员可以获取并分析目标用户的兴趣爱好信息,有效地支持对个体用户的行为认知、心理分析和个性分析。此外,探究群体用户的兴趣关注点,可以为广告投放、群体分类、舆情分析等多种研究提供理论和数据支持,产生更多的商业机遇和社会活动机会。本文面向多个社交网络数据源的用户兴趣数据,主要研究了如下内容:(1)本文采集了上万名Linked In(领英)社交平台的会员档案信息,收集了这些用户在主页填写的兴趣爱好信息,通过分词、同义词聚类等处理步骤,提炼出高频兴趣爱好词集。本文分别设计了兴趣爱好关联分析模型和兴趣爱好聚类分析模型,提出了一种基于二项集支持度的AGNES(Agglomerative Nesting)聚类改进算法,实证研究了兴趣爱好的关联特征与聚类特征。在研究过程中,本文利用用户的真实兴趣爱好数据集生成了多组强关联规则集合与兴趣爱好聚簇。(2)本文针对有确信Twitter(推特)账户的Linked In用户群体,采集了两个平台大量的社交网络用户兴趣数据。对于真实的抓取数据集和跨社交平台的应用场景,本文探究了如何改善传统基于关联规则的推荐算法,并提出了两类基于兴趣爱好聚类特征的混合推荐算法,有效改善了数据集和应用场景中遇到的数据稀疏性问题。(3)本文设计并实现了一个多源社交网络用户兴趣数据的采集与分析系统。将前述两部分研究内容应用于其中,提供了跨社交网络平台用户兴趣数据的采集、分析与推荐预测功能,并可以将结果应用在目标用户的属性分析之中。本文的研究成果可以佐证人类的兴趣爱好之间的确存在着大量的关联关系与固有的内在聚类特征,补充了兴趣爱好的多领域研究。本文提出的多种研究方法,能够应用于对社交网络用户潜在兴趣爱好的挖掘,还可以有效改善实际场景中的数据稀疏性问题。研究方法也为采集多源社交网络数据、分析社交网络用户以及个性化推荐提供了思路。
其他文献
高中生处于心理"断乳期",加上高中具有较大的学习压力,也是在成人过渡时期,尤其是情感日趋于丰富、思想敏感和人际关系复杂的阶段,从而引发了一系列的心理健康问题,而他们经
在小学里,社团文化并不丰富,而诵读社团正是可以开阔学生眼界、培养学生表达能力和艺术气质的好环境,如何在小学开展社团活动,是一个新的课题,在前人可以借鉴的经验比较少的
借助"网络资源"与"社会闭合"两种社会资本分析思路,结合对西部山区农村儿童的调查,发现其"网络资源"和"社会闭合"两种社会资本都比较缺乏。社会资本的缺乏直接影响到农村儿童
1983年湖北宜都城背溪遗址发掘简报湖北省文物考古研究所城背溪遗址位于湖北省宜都县(现改为枝城市)城关镇北面约10.5公里处,西南距吴家岗约0.5公里,北距宜都红花套遗址[1]哟?公里,东临长江,西边10-40米
美育在人类文明进程中起着不可忽视的作用。随着人们物质生活条件的不断改善,个人全面发展的要求日益突出,其中一个很重要的方面就是如何通过美育来丰富、发展人的精神生活。
我国翻译史上的“直译”与“意译”之争,就其实质而言,就是翻译美学的讨论,讨论翻译的内容和形式的关系问题。文章旨在通过对《静夜思》两个译本的对比分析,阐释翻译美学理论
清朝财政到嘉、道年间已因多年来收支失衡,形致拮据。1840年鸦片战争爆发,战费支出浩大;战败后,英国侵略者借机敲榨巨额赔款,加重了清政府财政困难。1851年太平军起义,14年间,内战蔓延18个省区,大
识字是读写的基础,识字是掌握书面语言的最初阶段。以1912年至1949年民国时期的国语教科书为载体,以其生字字量和字序的研究为核心,展开对民国时期小学国语教科书生字的研究
本文介绍了《安徽省农村房屋抗震技术规程》(DB34/T92-2009)的编制背景、编制过程、主要内容、技术特点等。规程针对安徽省农村地区自然环境的特征及农民自建房屋的现状,明确了