社交网络中基于机器学习的资源推荐方法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:echo_seaman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展和网络用户的普及,用户数量爆炸性地增长的同时社交网络的服务形态也在发生急剧的变化。这种情况下,用户想要快速获取感兴趣的信息或内容提供商想要进行有针对性的推荐,都需要通过有效的社交网络推荐技术。但是传统的推荐技术只考虑用户对项目的打分,项目本身的属性或者历史浏览记录,并没有考虑用户兴趣变化的规律,也不适应社交网络的新特性,如能获得的用户数据增多,用户兴趣多样化等。此外社交网络的数据集规模往往都是巨大的,这种情况下传统推荐技术的效率显得较为低下。针对以上问题,本文研究社交网络中基于机器学习的推荐方法,综合用户聚类,预测和推荐的相关技术,建立相应的推荐系统。该系统使用新浪微博的用户数据,经过预处理提取数据特征,然后使用基于Word2vec的聚类方法得到聚类结果,再进行马尔科夫链多兴趣预测,最后基于预测结果对用户进行推荐。该系统考虑到现实生活中用户兴趣变化具有可预测的规律性以及用户兴趣的多样性建立模型向用户提供兴趣推荐。实验结果表明该推荐系统具有良好的推荐性能。本文提出的社交网络中基于机器学习的推荐方法主要包括以下内容:(1)分析社交网络中的微博数据,进行基本的自然语言处理,包括使用NLPIR汉语分词系统进行分词,去除停用词,同义词替换等。考虑到用户发表的微博文本数据一般比较长,需要提取主要特征来进行进一步的处理。本系统使用Word2vec模型对数据进行处理得到对应的用户特征向量。(2)使用聚类算法将具有相似属性的用户聚成一类,并对用户进行多兴趣预测。本文提出基于Word2vec的聚类方法以实现聚类,该过程能够缩小搜索范围,提高效率,并使得用户定位更准确。然后考虑到用户兴趣的多样性,提出多马尔科夫链多兴趣预测模型,使用该模型能够根据用户特点预测用户的多项兴趣并以此建立用户的需求特征。(3)综合以上结果,本文在传统基于用户的协同过滤推荐算法基础上,综合考虑历史兴趣和预测兴趣两个因素,向用户推荐其感兴趣的关键字标签。该推荐系统考虑了用户多兴趣类别的属性,并使用了聚类和预测两种机器学习算法来改进推荐的性能,实验证明该方法具有良好的推荐表现。
其他文献
目的了解和评价2016年济南市放射工作人员的健康状况。方法收集2016年济南市916名放射工作人员的基本信息和相关健康指标,并根据性别、年龄、工龄和工种分组评价其健康状况。
2019年7月9—11日,《木门分类和通用技术要求》等标准宣贯培训暨木材工业产销监管链认证研讨会在浙江江山市圆满召开。会议由全国人造板标准化技术委员会、全国木材标准化技
当前,农村公共卫生发展普遍滞后,与社会主义新农村建设的要求极不适应,由此而出现的农民因病致贫、因病返贫的现象,从一定程度上迟滞了新农村经济的发展和农民富裕程度的提高
目的:观察中药熏洗对环状脱垂性内痔TST术后疼痛及恢复进程的影响。方法:随机双盲法将符合纳入标准的76例环状脱垂性内痔患者分为两组,每组38例,均行选择性痔上黏膜切除吻合
当下文化的发展日趋多元,旅游业可以利用文化的整合推动发展。文化不仅是旅游业发展的灵魂,更是旅游业在新的时代背景下不断创新和整合的动力。通过分析多元文化的时代内涵,加强
<正>学校教育与家庭教育相互依赖、相互配合,分别发挥不可替代的作用。因此,加强班主任与家长之间的沟通、合作,对教育学生有着至关重要的意义。然而,我们有些班主任与家长沟
期刊
海洋中蕴藏着巨大的能量,如果我们能够提取这些能量,就能为地球提供足够的能源和动力。爱丁堡并非是工业间谍活动肆虐的地区,但在一个凉爽而宁静的春夜里,在这个苏格兰城市里
贵州是西部的一个多民族省份,拥有得天独厚的民族文化资源。当前,为发展民族经济,各少数民族都积极投身文化旅游潮流。但多元文化格局给发展提出更高要求,如何处理好发展中的一系
研究了一种单LEM电流检测双降压式半桥逆变器,该逆变电路无桥臂直通,可以实现功率开关管和续流二极管的最优设计。采用一个LEM电流传感器,通过精密整流电路提高了电流检测的精度
我国国产机载操作系统天脉,是中航工业计算所拥有的国产嵌入式操作系统品牌。天脉系列国产操作系统具有自主知识产权,具有超高的实时性、安全性以及可靠性。但天脉操作系统作