基于马尔科夫的兴趣漂移及微博推荐

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:gdgyhpp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文基于当前最流行的社交媒体之一——新浪微博进行研究,并针对当前推荐系统现状和存在的一些问题展开论文研究工作。随着大数据时代的到来,互联网数据呈几何倍增长,各种社交工具也层出不穷,facebook、youtube、新浪微博等工具逐渐成为用户发布和获取信息的重要平台。如何从大量信息中获取自己想要的信息,关系到用户的实际体验,更关系到商家的产品竞争力。在此基础上,互联网用户的个性化推荐系统应运而生。目前流行的推荐算法有基于内容的推荐、基于协同过滤的推荐、基于兴趣的推荐和混合推荐等。基于用户兴趣的推荐是多种推荐方法中重要的一种。该推荐方法旨在挖掘用户潜在兴趣,达到对用户更全面的理解从而提升推荐的准确率。为了更准确地捕捉用户兴趣的变化,兴趣漂移理论应运而生。兴趣漂移方法主要有时间窗口法、遗忘函数法、马尔科夫理论法等。本文以马尔科夫理论为基础,以微博文本为背景,提出了多状态转移马尔科夫链的转移概率矩阵计算方法和基于马尔科夫链融合的兴趣预测方法。文章首先使用潜在狄利克雷模型提取用户微博的潜在主题和主题概率,将潜在主题作为用户的兴趣,并根据微博和模型的特点计算用户的兴趣度,然后使用主题演化理论模拟用户兴趣的动态变化。由于传统的马尔科夫链是单状态的转移,不能很好地应用于微博用户多兴趣同时转移的情况,本文提出了多状态同时转移的转移率矩阵计算方法,并为每个用户建立马尔科夫链模型。为了更好地做出推荐,使用综合了语义相似度和概率相似度的用户兴趣相似度算法寻找相近的兴趣,并综合兴趣度寻找用户的相似用户。将相似用户的兴趣和转移率矩阵进行融合,使用融合后的马尔科夫链预测用户兴趣。基于用户兴趣度最高的几个兴趣为用户推荐Top N个微博。最后使用微博的真实内容作为实验数据,对影响模型的多个参数做了对比实验寻找参数的最优值。最后对模型的准确率和推荐效率进行了对比实验,结果表明,该算法有较高的预测准确率和更快的运算速度。对推荐的实际应用有一定的借鉴作用。
其他文献
近年来,有机-无机杂化钙钛矿太阳能电池吸引了各界的广泛关注,其效率已由最初的3.81%迅速突破22.7%。该类材料具有大的消光系数、长的载流子迁移距离、高的电荷迁移率、两极
近些年以来,我国经济的不断地发展和提高,随之而来的就是日益增长的能源消耗和环境污染的问题。“雾霾”和空气污染也成为了人们日常生活中的一个热门的大话题。如何有效的利
电力部门是支撑社会经济发展的关键部门,为社会经济发展提供所需要的电力。同时,电力部门也是最大的能源消耗部门,是最大的CO2排放源。一方面,以中国、印度为代表的发展中国
锂离子电池因具有比容量高、能量密度高、完全无记忆效应、循环使用寿命较长、充电/放电速度快、安全性高、工作电压高、自放电率低、清洁等优点,被广泛应用于便携式电子设备
目标检测的目的是检测图像和视频中感兴趣的目标物体,已被广泛应用于行人检测、车辆检测、智能安防等领域,具有重要的理论和实际应用价值。现有大型目标检测网络模型的识别精度高,但存在对小目标物体误识别、不识别和不同个例因候选框重叠度高而丢失的问题,以及过于庞大的模型参数量和计算量导致模型难以在移动设备端部署的问题。本文以小目标物体检测及模型轻量化设计为研究内容,以提升小目标检测模型性能、降低模型复杂度为研
电阻层析成像(Electrical Resistance Tomography,ERT)是电学层析成像(Electrical Tomography,ET)的一种模态,具有测量给定工艺设备内电导率分布的能力。该技术通过在被测物
随着国民生活水平的提高,国民更加注重资产的投资,而我国商业银行在最近几年为了满足投资者的需求,纷纷推出了各类理财产品,银行理财产品数量也在逐年增加,投资者数量也越来
现代化战争对于武器的要求越来越高,为了达到导弹设计的总体要求,需要对发动机壳体的结构强度进行不断地优化。在研制过程中,为了得到发动机壳体的强度性能,需要由试验台进行
在发生地震的近断层区域,由于断层滑冲方向和地震动传播机制的影响,可以产生两种不同形式的速度脉冲型地震动,分别为近断层滑冲型脉冲地震动和近断层向前方向性脉冲地震动。
作为我国负责管理税收和经济的主要行政机构,税务机关面临着如何能够有效管理数百万的干部职工,负责着上亿纳税主体和税款征收的重大问题;应对着干部职工没有动力不求上进的