融合用户标签和微博内容的用户兴趣社区发现

被引量 : 7次 | 上传用户:haisheng1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的不断发展,微博已经成为了人们日常生活中不可或缺的一个重要组成部分。微博当中,微博用户的自定义用户标签以及用户发布微博,转发微博等微博行为,反映了用户的兴趣爱好,如何通过这些信息,挖掘用户兴趣,发现用户兴趣社区,具有重要的研究意义和价值。本文针对微博用户兴趣社区发现,主要从以下几个方面展开了深入研究与探讨:(1)提出了一种基于特征映射的用户标签兴趣建模方法。针对用户标签反映用户兴趣的特点,选择用户标签作为用户兴趣模型的特征,并为了解决标签表述不一和长标签所带来的数据稀疏问题和噪声影响,引入特征映射的思想,将长标签进行分词处理,表示成子标签集,通过计算标签之间的相似度,将用户标签映射到相似度最高的特征维标签,利用标签相似度和标签频率的乘积作为特征维的特征值,构建用户标签兴趣模型,并利用模糊聚类方法,验证用户标签兴趣建模的有效性。(2)提出了一种基于有指导LDA的用户微博内容兴趣建模方法。针对微博文本交互对微博主题分布的影响,提出了一种有指导的LDA微博生成模型,综合考虑了转发微博,评论微博,回复微博,他人评论四个因素对用户微博兴趣主题分布的影响,在传统LDA模型的基础上,构建有指导的LDA微博生成模型,得到微博主题分布,并进一步得到用户主题分布,从微博内容角度对用户进行兴趣建模。(3)提出了一种融合用户标签和微博内容的用户兴趣社区发现方法。在(1)和(2)的基础上,利用用户模型相似度,构建用户标签兴趣关系网和微博内容兴趣关系网,与微博当中本身存在的用户关注关系网进行融合,并在此基础上,考虑微博用户可能属于多个社区所造成的社区重叠问题,提出了一种基于k-clique的用户兴趣社区发现方法,通过对社区重叠矩阵进行求解,得到社区连接矩阵,最后得到包含多个相连k-clique的用户兴趣社区。(4)利用上述研究成果,设计实现了微博用户兴趣社区发现原型系统。
其他文献
目的采用前瞻性双盲研究方法评估早孕期无创产前检测(noninvasive prenatal t esting, NIPT)对胎儿性染色体非整倍体、21三体(trisomy21, T21)、18三体(trisomy18, T18)、13
改革开放30多年来,社会主义市场经济体制从无到有,逐渐完善,并取得了巨大的成功。作为市场经济的主要载体和核心力量,企业发展的好坏直接关系到我国社会主义市场经济发展的好
农村信用社是我国金融体系的重要组成部分,是支撑和推动我国农业经济发展的重要力量。目前我国农村信用社已进入了一个新的发展阶段,信贷规模以前所未有的速度快速扩张。近年
本文运用文献资料法、问卷调查法、数理统计法等研究方法,对我国中部大别山地区的农村中学体育课程改革的现状进行调查与分析研究。结果表明,农村中学体育课程改革的理念已明
运用文献资料法、专家访谈法,借用社会设置理论,对学校体育核心价值进行研究。结果表明,传统思维中增强体质、增进健康作为学校体育的核心价值并不完全确切;在生物体育观至上
本文以分子相互作用体积模型(MIVM)及其伪多元近似法为基础,研究了高炉冶炼钒钛磁铁矿过程中Ti元素在熔渣与铁液相间的平衡分布及走向。为实现钒钛资源综合利用提供基础数据
异化劳动理论在马克思主义的形成和发展过程中占有非常重要的地位。马克思在《1844年经济学哲学手稿》中从四个方面对资本主义社会的异化劳动进行了揭示。与以往的异化理论不
近年来,随着我国经济的发展,大型民用工程、高层建筑、大跨度桥梁和水利设施等土木工程的兴建,学术界和工程界对土木工程结构进行实时、在线的健康监测的研究逐渐成为热点。在土
压电智能材料在土木工程结构健康监测领域受到了广泛关注。为提高压电传感器与混凝土间的力学相容性,本文优化了封装材料,并以压电陶瓷为传感元件制备了压电传感器。研究了压电
十六届三中全会以来提出与实践科学发展观的过程,也是中共和平统一思想与时俱进、创新发展的过程。从新时期两岸关系基本特征出发,确立现阶段两岸关系以和平发展为"主题",正