基于知识图谱构建的微博话题推荐研究

来源 :安徽理工大学 | 被引量 : 4次 | 上传用户:gmailzyn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于微博用户的数目急剧的增加,每天在微博平台产生的话题数目也随之大量的产生,面对着大量产生的话题,用户往往很难筛选出自己感兴趣的话题。为了解决这个问题,本文提出了基于知识图谱构建的微博话题推荐算法以其帮助用户找到自己感兴趣的话题,使得微博话题能被其感兴趣的用户浏览。主要的研究内容如下:(1)建立微博话题知识图谱。先对获取的微博文本进行预处理,将处理后的微博文本使用学习到的前后缀规则获取命名实体。接着对微博语句进行依存句法分析,通过Bootstrapping微博关系抽取算法抽取微博关系。最后将命名实体视为节点,抽取的对应关系视为连接两节点的边,通过软件绘制实现知识图谱的可视化展示。(2)建立话题用户兴趣度矩阵。定义用户微博词语特征词集合(User Weibo word feature set),并使用TF-IDF依据用户微博历史数据进行获取。将微博话题知识图谱与微博话题知识图谱进行匹配,获取用户兴趣度矩阵,得到选取所有用户对所有话题的偏好。最后再将用户使用划分聚类的方法k-means进行聚类分析。(3)基于话题知识谱图和用户兴趣度的微博推荐。我们首先定义了微博话题命名实体系数,用来表征微博话题的命名实体对于用户的重要性,然后在微博话题知识图谱和用户聚类分析的基础上,将微博话题进行基于话题知识图谱的协同推荐,获得微博话题推荐集合。再将待推荐的微博话题特征词权值向量与微博话题命名实体系数构成的向量进行相似度计算,基于用户内容的筛选,获得相似度高的推荐话题集合,最终获得推荐集合。经过实验的数据的验证,基于话题知识图谱的微博推荐算法可以使推荐给用户话题的准确率有很大程度的提高,很大程度上减轻了用户寻找感兴趣话题的时间,及时高效的帮助用户获取了对自身有用的信息。本文创新地将微博话题知识图谱和协同过滤推荐结合起来,通过建立用户兴趣度矩阵很大程度的缓解了协同推荐的冷启动问题,并定义了微博话题命名实体系数,将协同过滤获得的话题中不符合用户偏好的话题进行过滤,最终提高了推荐的准确率。图[13]表[16]参[62]。
其他文献
为探讨甘草渣中多糖的分离纯化条件及抗氧化活性,进行了大孔树脂的选择实验研究,并由大孔树脂动态吸附实验及动态洗脱实验研究确定了HPD-722大孔树脂分离纯化甘草渣多糖的最
针对企业管控一体化对企业现场监控系统的需求,提出一种C/S和B/S混合的3层监控系统。该系统的C/S使用OPC技术以统一客户端和服务器端接口,客户端部署Web Services实现C/S功能
<正> 垛料升降台是叠轧薄板生产后部工序中重要生产设备,主要用于钢板收集与堆垛,早期的5t机械升降台起升重量偏小,垛料时吊运次数频繁,生产效率低,并且造成大量钢板边部吊伤
骨性关节炎是一种以活动关节的缓慢性、进行性疾病,中医学中属于"骨痹""痿症"的范畴。在老龄化社会国家,病人总数呈上升趋势。目前认为该病发生与年龄、性别、负荷、关节软骨
在某些工程中,桩基呈现一定的倾斜度比竖直桩更具有承载性。现利用ABAQUS有限元软件分别对竖直桩、倾斜度为2&#176;、4&#176;、6&#176;、8&#176;的桩基进行横向受力加载,模拟
<正>三角形是最基本的几何图形之一,2008年各地的中考试题中出现了很多立意新颖、构思巧妙的以"动态三角形"为载体的客观性试题.题目虽小,却既考查了几何基础知识,也注重了
<正>在日常教学中,开放性数学试题的编拟是一个困难问题.一般而言,编拟开放性试题的方法有:某些问题的联想、类比、拓广,某些问题的逆命题及其类比和拓广.其中“某些问题”可
文章研究立足广州、佛山地区,面向珠三角,服务现代服务业,依托汽车制造企业、销售企业、行业协会、汽车展览公司组建汽车营销人才培养基地和实践平台,整合社会资源,提出培养
小微企业是促进我国当前经济发展的重要力量,在国民经济建设过程中的地位和作用也日益凸显。由于受到管理理念的影响,很多小微企业在自身会计信息的监管工作上仍有不少盲区,