基于主题模型的微博用户推荐研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:ljnbba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来微博凭借着手机客户端发展迅速,微博中信息也呈指数增长,因此产生了信息过载的问题。在不计其数的信息海洋中准确的找到感兴趣的内容存在较大难度。针对上述问题,本文提出了基于主题模型的用户关注推荐。具体研究内容如下。首先,通过对主题模型LDA的研究发现,基于LDA的主题模型虽然能够得到用户的微博主题概率分布,并根据主题概率分布可以计算出用户的主题相似度,但在情感丰富的社交平台上,还略显不足,因其忽略了用户的情感因素。因此,本文提出了计算用户相似度的RJS算法,RJS算法的思想是通过JST模型得到用户的主题概率分布和情感倾向。用JS距离计算出用户主题概率分布的相似度,并结合用户主题的情感倾向计算出最终的用户相似度,得到用户的相似度评分。其次,基于微博的特点提出了微博用户影响力模型UIM。UIM模型将用户影响力分为三部分:微博影响力;用户活跃度;用户的粉丝数。通过定性分析三个指标,得到了用户影响力评分的计算方法;利用层次分析法计算三个指标的权重并对其结果进行了检验;将三个指标通过权重线性结合起来,得到用户影响力评分的计算公式,通过计算就可以得到用户的影响力评分。最后,将RJS算法与UIM模型结合起来提出了本文的用户推荐算法R-UIM,利用R-UIM算法得到综合评分,将评分最高的推荐给目标用户。实验结果表明本文提出的推荐算法在微博关注推荐中取得了很好的效果,并通过与标准LDA、LDA+UIM、RJS模型的推荐效果进行了实验,验证了本文推荐算法R-UIM的优势。
其他文献
自从1981年开市以来,中国债券市场蓬勃发展。然而直到2014年11超日债的违约,才最终打破了我国债券市场始终存在的刚性兑付问题。之后债券违约事件逐年增加。本文将研究债券违
多目标优化问题普遍应用在实际的各个科学邻域和工程项目中。传统的多目标优化算法大多是将多个目标通过增加权重向量转变为多个单目标,随后对单目标实现优化求解。然而,权重
自从2003年6月三峡库区首次蓄水以来,库区范围内的地质灾害屡见不鲜,其中以滑坡灾害为主,造成了较大的经济损失和人员伤亡。本文以三峡库区八字门滑坡为研究对象,依据滑坡的勘查报告、专业监测资料等,对滑坡的变形机理、变形特征进行研究分析,结合Geo-Studio软件进行数值模拟,分析在不同的库水位的升降速率和降雨工况下,滑坡体内的渗流场和稳定性系数的变化规律,并运用数理统计中的正交试验设计法,对滑坡稳
在2010年2月6日揭晓的“汉语盘点2009——用一个字、一个词描述中国与世界”活动中,“被”字当选为描述中国的第一字(侯敏&周荐,2010)。“被”在汉语中本是一个承担表示被动
当今国际环境全方位开放,中西方文化处于相互冲击和融合之中,各种思想和价值观念鱼龙混杂,泥沙俱下,对社会主义核心价值观造成了巨大冲击。建构社会主义核心价值观已经成为我
近年来随着网络的广泛普及,互联网正在一步一步地改变着人们的生活。由于互联网中存在海量资源,人们如何从中快速地,准确地挑选出有效信息显得尤为关键。例如,从百度上搜索鲜
高中地理课程标准将“地理实践力”作为核心素养之一,地理实验是培养地理实践力的主要途径。地理实验是一种新的教学方式,它对发展学生积极的性格和健全的人格以及基本地理实践能力有着重要的作用。与自然地理实验不同,人文地理实验发展的较晚,没有标准的实验器材,也没有自成体系的实验案例。因此本文通过分析人教版教材探究高中人文地理实验案例设计。本文主要运用了文献法、访谈法、问卷调查法和案例法,对高中人文地理实验教
我国正处在社会体制的转型阶段,随着政治体制变革的深入和研发投入的增加,政府廉洁度与研发投入之间是否存在着关联则越来越受到人民群众的关注。从官方媒体所公布的报道来看
机器翻译是自然语言处理领域一项很热门又极具挑战性的研究内容。从20世纪30年代提出机器翻译想法到如今把句法信息融入机器翻译,国内外学者设计了很多机器翻译的形式模型及
《沉默》(1966)是远藤周作(Shusaku Endo,1923—1996)的第一部长篇小说。小说讲述了江户幕府禁教时期,一名葡萄牙传教士突破艰难险阻来日本传教的故事。《沉默》这部小说的创作,由远藤周作的一篇文章《从一块踏板开始》开始。为了完成构思,身患肺病躺在病床上的远藤周作写了许多与《沉默》题材相关的短篇小说,最终集结成短篇小说集《哀歌》(1965)。《哀歌》与《沉默》关系密切,这些小说的共