基于主题模型的突发话题推荐算法研究

来源 :江苏科技大学 | 被引量 : 1次 | 上传用户:goudongxi521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的普及,Facebook,Twitter,微博等社交网络平台凭借其方便快捷的特点迅速普及,逐渐成为传统媒体以外的一个重要的信息来源。许多用户使用社交平台来表达自己的感受,与朋友分享感兴趣的内容与话题。同时社交网络上许多突发性话题,往往会在网络社交平台上发布,借助用户的好友转发机制迅速传播,引起广泛的社会共鸣,进而产生巨大的社会影响。人们面临的问题不仅是如何在海量的互联网信息跟踪突发事件和舆情走向,还需要从中找到自己真正感兴趣的实时话题信息,因此,一个能检测突发事件并推送给感兴趣用户的推荐算法能够带来更好的用户体验。鉴于以上需求,本文在前人研究的基础上,以新浪微博为研究平台,改进了传统话题检测技术并提出了一种基于主题模型的微博推荐方法。本文主要工作有以下三个部分:首先,根据新浪微博中突发事件发生的突发特征,使用突发词特征来检测微博中的突发话题,并使用LDA主题模型获得突发微博的主题概率分布。其中,使用相对词频,词频增长率,突发权重三个特征来筛选突发词,将存在突发词的微博标记为突发微博,同时对突发微博进行主题建模。实验证明实际采集的微博文本数据不仅提高了话题检测效率,还更好地降低了噪声微博的影响。其次,针对微博中不同的用户行为表征用户对微博主题的不同感兴趣程度,提出了一种融合用户行为的LDA扩展模型,该模型将同一用户的所有微博文本按照不同的用户操作行为聚集成不同的用户文档,并采用吉布斯采样方法估计参数,将用户文档中的特征词向量转换为该用户在不同行为上的主题概率分布,从而体现用户在不同主题上的兴趣偏好。最后,在协同过滤推荐算法中引入信息计量学中的信息老化理论,通过整合用户的兴趣度和信息时效性参数来调整推荐权重,与传统的推荐算法相比,改进后的推荐方法时效性更高,能够推荐具有突发性质的微博给感兴趣的用户。
其他文献
为提升职业教育人才培养质量,加强对办学质量的诊断,通过电子邮件、校内问卷调查、集中座谈、毕业生问卷调查等方式,结合学院毕业生麦可思调查分析报告,应用统计数据,探索了
本文针对低中频接收芯片设计时对高镜像抑制的要求,设计了一款反馈调制的镜像抑制滤波器,该结构通过反馈I、Q两路中频输出的相位和增益误差的方式提高镜像信号抑制度。该电路
学生申诉权是公民行政申诉权在高校的具体表现形式,也是高校依法治校的必然要求。在新修订的《普通高等学校学生管理规定》颁布实施后,修订、完善高校内部的申诉办法,使其更
雪灾是自然界常见的主要灾害之一,其影响范围波及建筑、交通、畜牧和能源等多种产业,给人类社会的生产生活带来了严重影响。近年来随着全球性气候变化加剧,极端低温冰雪灾害
电力供给和负荷需求之间的不平衡常常会引发电力的波动或中断,造成电力设备损坏,因此,保证电力负荷需求与生产之间的平衡是电力生产和运行的一个关键问题。对于电网而言,准确
海上工程勘察,应根据勘察任务,施工海域水文条件,选择合适的施工平台。根据地层条件,制定合理的施工工艺,确保勘察质量。
本翻译实践报告所选文本取自作者马修·扎卡赖亚所著回忆录——《重新定义我的故乡:一部回忆录》(Making Anew My Home:A Memoir)的第一章至第三章,译文约四万字。该书主要讲
第1课时一、学业目标 1.知识与技能:①了解水圈的概念;②了解陆地各种水体的存在形式及所占比例;③了解水循环的概念、分类、环节及意义。 2.过程与方法:通过绘制水循环的全
乳清蛋白具有重要的营养价值,应用范围很广,主要阐述了从蒙古族传统乳制品生产中得到的副产物乳清中开发利用乳清蛋白,并进行工业化生产的思考。
主要研究了以活性炭作为吸附剂,以孔雀石绿和酸性铬蓝K作为水污染物时吸附条件的改变对活性炭脱色率的影响。/JDA相同质量的活性炭,当孔雀石绿浓度为8.0mg/L,酸性铬蓝K的浓度为16mg