面向兴趣主题的新浪微博个性化推荐方法

来源 :河南大学 | 被引量 : 0次 | 上传用户:lionschen2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为典型的社交网络媒体,微博通过自身独有的特点,吸引大量的用户。随着用户数量的增加,微博的热点话题也在不断涌现。越来越多的研究人员和学者热衷于探索微博数据中包含的有用信息,从而挖掘用户喜爱的微博所具有的特征。但由于微博的内容比较复杂,当面对海量的微博文本时,用户通常不能快速准确地找到自己感兴趣的微博,而且用户的需求呈现个性化、多样化趋势。因此,在海量的微博信息中,如何为用户找到其感兴趣的微博信息是亟待解决的一个重要问题。围绕该问题,本文开展的主要工作如下:(1)用户微博兴趣主题挖掘:根据用户的历史微博信息,将每个用户的微博信息建模为文档,通过LDA(Latent Dirichlet Allocation)主题模型得到用户微博词汇概率分布矩阵,进而从中挖掘用户感兴趣的微博主题,为个性化的微博推荐奠定基础。(2)基于主题相似度与转发量的微博个性化推荐:为了向用户推荐高质量的热点微博,考虑到传统的微博推荐只是将主题间的相似度作为推荐评分,没有综合利用微博本身携带的功能(如转发量、评论数、粉丝数等)。因此,本文将用户兴趣主题与当前的热点微博主题进行相似性计算,同时考虑用户转发微博的数量(转发量),将主题相似度与微博转发量相结合来计算微博的推荐指数,将推荐指数较高的热点微博推荐给用户。最后,采用新浪微博数据作为实验载体,通过实验验证本文所提方法的有效性。
其他文献
随着无线通信传输和互联网等技术的不断革新,人们对无线传输性能的需求也在不断提高。全双工技术作为一种有效提高网络传输性能的手段,备受各国研究者关注。同时,无线多跳网
通过叶绿体trnK基因的内含子matK序列及核糖体转录间隔区(ITS)序列研究初步分析了中国原生棕榈科18属间的系统发生。主要结果有以下三点:1)测定了3种中国原生棕榈科植物ITS序
目的:了解河北省农村环境卫生现状及农民环境污染意识,为各级政府决策提供科学依据. 方法:随机抽取23个县(区)的68个村庄作为调查对象,采用统一调查表调查. 结果:对
本文研究了 15株不同地理来源、不同种属的虫生真菌代谢物抑菌活性,发现亚肉座菌Hypocrellasp.ZJJ-13的代谢物对金黄色葡萄球菌抑菌效果最为明显,MIC为0.078 mg/ml。采用理化
本论文以氧化石墨烯为载体制备了石墨烯基磁性复合材料(磁性氧化石墨烯、壳聚糖交联磁性氧化石墨烯、磁性介孔二氧化硅/氧化石墨烯以及磁性β-环糊精/氧化石墨烯),并对复合材料
同伴教学法是指学生同伴之间相互施教、共同受益的一种教学组织形式。本研究试图将同伴教学法应用到英语词汇学习中来测定其对学生学业成绩和学习态度的影响。实验以山东水利
根据国际葡萄膜炎研究组1979年制定的分类,葡萄膜炎可分为前葡萄膜炎、中间葡萄膜炎、后葡萄膜炎和全葡萄膜炎。前葡萄膜炎(anterior uveitis)是葡萄膜炎中最常见的类型,患者多
随着社会的发展,科技的进步,行业分工越来越细,一学定终身的现状已被悄然打破。但由于人们的认识水平、地区差异等因素的影响,靠个人自觉提高以实现社会化的要求显然是不可能的。
本论文包括三部分内容:第一部分:Ph样急性淋巴细胞白血病的诊断流程优化及相关生物学特征研究;第二部分:CRLF2基因在急性B淋巴细胞白血病中的表达及意义研究;第三部分:四例EPOR重排的Ph样急性淋巴细胞白血病的临床及实验室研究。第一部分:Ph样急性淋巴细胞白血病的诊断流程优化及相关生物学特征研究目的:建立快速便捷的Ph样急性淋巴细胞白血病(Philadelphia-Like Acute Lymp
近年来,随着市场经济的进一步发展,商业环境以组织中的授权和赋权、社会多样性日益增加以及技术的快速变革为特征。个体在进行决策时,由于缺少方向性指导,而有了更多选择的自由。尤其是在企业管理中,个体而非组织成为了决定企业道德方向或组织伦理氛围的关键力量。同时,商业伦理的大多研究认为情绪是个体道德判断形成过程中不可忽视的因素。尽管许多实证研究表明,情绪是一个对道德判断的形成具有调节作用的主体因素,但其调节