基于社交网络的同城活动推荐方法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:likemagicliyong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网的快速发展与互联网技术的不断创新,社交网络日益成熟和完善。在众多的社交网络类型中,有一种以活动为媒介将线上与线下相结合的社交网络——活动社交网络(Event-based Social Network,EBSN)。和传统的社交网络相比,活动社交网络中的用户既可以线上浏览活动信息,又有可以根据活动信息决定是否线下参加该活动。随着时间的推移和网络的发展,活动社交网络中产生的海量数据使得用户难以快速找到自己感兴趣的活动。因此,急需基于活动社交网络的推荐系统来为用户做活动推荐,提高用户体验。社交活动推荐与传统的推荐有所不同,主要有:(1)活动的“一次性消费”特性。活动是人为发起的,具有特定主题、时间、地点,用户只能参加一次,无法像商品一样反复购买,且没有历史评价记录。(2)活动社交网络中有更多的信息可用于推荐。活动社交网络可以形成两种社交关系,一种是用户通过加入兴趣小组等形成的线上社交关系,另一种是用户通过参与相同的社交活动而形成的线下社交关系。此外,还有用户和活动的时间、地理位置等信息。这些不同使得活动推荐不能直接采用传统的推荐方法,因此本文研究社交活动推荐。本文针对上述特点和现有的社交活动推荐中存在不足之处,在已有的推荐相关理论与技术的基础上,给出了本文的基于社交网络的同城活动推荐方法并对其进行有效性验证。本文的主要工作包括:(1)给出了一种基于社交网络的同城活动推荐模型。模型包括数据获取模块、特征提取模块、学习排序模块和推荐模块。数据获取模块解决数据获取问题,并将数据分为训练数据和待推荐数据。特征提取模块是分析数据信息,提取出用户偏好、好友影响、时间匹配度、位置匹配度、活动主题流行度五个特征。学习排序模块是将推荐问题转化为学习排序问题,通过对活动进行学习排序,得到衡量所有特征的最优权重W。推荐模块是根据用户IP判断用户城市,从而选择用户的候选活动,根据最优权重W计算出用户对候选活动的评分,根据评分为用户推荐top-N的活动。(2)分析并提取了用户偏好、好友影响、时间匹配度、位置匹配度、活动主题流行度五个特征,并给出各个特征的计算方法。用户偏好采用基于内容的推荐方法,计算出用户与活动在主题向量的相似度。使用LDA方法表示对用户和活动主题向量,降低了文本维度,缓解了数据稀疏问题。好友影响采用协同过滤方法,将用户偏好视为用户评分,同时将与用户主题相似度最高的K个用户视为其好友。时间匹配度和位置匹配度分别挖掘用户在时间和位置特征上的行为规律,计算用户和活动在时间与位置上的相似度。活动主题流行度这一特征是为了衡量活动主题与城市流行主题之间的相似度,城市流行主题是指该城市近期的参与度最高的M个活动的主题。同时,活动主题流行度可以在一定程度上可以降低冷启动问题对活动推荐的影响。(3)给出了一种基于社交网络的同城活动推荐算法。将活动推荐问题转化为学习排序问题,并借助成对学习排序的思想,将活动组成序列对,分为正序列对和负序列对,从而将问题转化为针对活动序列对的二分分类问题。为综合考虑各个特征的影响,本文对逻辑回归方法进行改进,使其适用于成对学习排序问题。采用平方损失作为损失函数,在求解过程中,采用批梯度下降法进行求解,并为损失函数添加正则化项以防止过拟合,同时添加用户系数以调节用户数据不均衡带来的影响。本文的活动推荐方法是:采用改进的逻辑回归排序方法融合用户偏好、好友影响、时间匹配度、位置匹配度、活动主题流行度五个特征,计算出用户对候选活动的综合评分,并以此进行活动推荐。为验证本文给出的方法的有效性,实验选取准确率和召回率作为推荐结果评估指标,利用豆瓣同城中的数据,与现有的常用的几种活动推荐方法进行对比分析。实验结果表明:相对于单一特征的推荐方法,本文的融合了多特征的活动推荐方法效果更好;相对于其他四种经典的活动推荐方法,本文的改进的逻辑回归排序的活动推荐方法效果更好,能够更有效地为用户进行活动推荐,提高用户的体验,满足用户需求。
其他文献
智能移动机器人路径规划是移动机器人导航技术中最重要的环节之一,它是指在给定智能机器人及其工作环境信息下,按照一定的优化指标,在起始点和目标点之间规划出一条与环境障
随着信息技术和无线通信技术的迅猛发展以及在各个领域的不断渗透,信息系统在医院的应用也在不断深入,这些方面促使医院的工作效率和医疗服务质量得到显著提高。现代信息技术
随着多媒体技术与网络技术的融合,视频、图像类的应用已对人们生活的各个方面产生影响。对视频、图像类业务的研究开发已经成为当前计算机学科的热门课题。视频、图像编码技
随着各种智能电子设备在人们生活中的广泛应用,比如智能手机,平板电脑,笔记本电脑等各种移动智能设备,人们越来越倾向于通过不同的智能设备来完成相同的任务。然而,当用户在
动态心电图(Ambulatory Electrocardiogram,AECG),又称Holter,经过四十多年的发展,其在无创心电辅助诊断技术领域应用非常广泛,成为临床上最为常用的心脏检查和医疗监护工具之一。
随着数据库日益增加的需求和信息技术的飞速发展,集中式数据库已越来越不满足当前数据存储的需求,因此分布式数据库系统应运而生。而在分布式数据库系统的设计中,数据分配问题是
近30年来,图像分割一直是图像分析和计算机视觉一个活跃的研究方向,大量的图像分割算法被提出。图像分割是图像分析的一个中间环节,分割质量的好坏直接影响后续处理的质量。图像
随着企业不断加大科技投入,计算机仿真技术得到了广泛的重视,它具有经济、安全以及可重复性等特点,利用计算机仿真技术可以进行现场难以展开的工作,降低实验风险,提高投资安全性。
医学图像分割技术是医学图像处理与分析领域的重要课题之一,也是近年来备受研究人员关注的热点问题。由于人体解剖结构的复杂性、组织器官形状的不规则性及个体之间的差异性,
二十一世纪以来,伴随着科学技术的迅速发展,人们每天都要处理大量的信息数据(例如图像、视频以及文档资料等)以便进一步地分析和研究。图像作为常用信息的载体之一,在人们接