基于BTM主题模型的微博群体用户画像研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:shao402248950
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的不断发展,以微博、微信等为代表的社交媒体平台发展十分迅速,逐渐对人们的日常生活产生了巨大影响。人们在这些平台上自由地交流、表达个人情绪、分享个人意见的过程中产生了海量的信息数据,如何有效利用这些海量信息,创造出更有价值的用户服务是当今研究的热点。本论文在充分考虑微博数据特点的基础上,提出一种新颖的基于BTM(Biterm Topic Model)的微博群体用户画像模型GUPTM(Group User Profile Model based Topic Model),将用户的背景信息、社交信息、主题兴趣紧密联系在一起,从而构建出更为精准、全面、细致的社交平台微博群体的用户画像。同时,对群体用户画像在网络舆情治理方面的应用展开详细研究,最终为网络舆情治理提出新的治理对策。论文的主要研究内容如下:首先,提出一种新的基于BTM主题模型的微博群体用户聚类方法。从微博平台获取用户自由发布和分享的信息,建立模型数据集;对其进行用户关系分析和数据预处理,然后利用BTM主题模型挖掘用户的主题兴趣;分别计算用户背景信息相似度、用户社交信息相似度以及用户主题兴趣相似度,再将三种用户相似度进行充分融合,创造出更有效的相似度计算方法;基于该方法的计算结果,运用K-means聚类实现用户分群。其次,构建基于BTM的微博群体用户画像模型。阐述群体用户画像模型的框架与流程;对微博用户数据进行预处理后运用吉布斯采样算法对GUPTM模型进行参数推断,以此获得模型中的关键参数;使用本文提出的新型群体用户聚类方法进行用户群体聚类,然后利用聚类结果对微博用户进行群体特征提取;最终,利用群体特征构建出微博群体用户画像。最后,在网络舆情治理的背景下,对微博群体用户画像展开应用研究,结果显示该群体用户画像能有效帮助舆情引导,提高舆情治理效率。相应的,文章在最后针对网络舆情治理提出了新的治理对策,为后续研究人员提供一些理论参考。
其他文献
研究目的:特大跨钢桥在荷载作用下有竖向位移大、自振频率较高的特点,轨道结构的选型直接影响到大桥自身的安全及列车的正常运营,本文通过对国内外钢桥轨道结构选型的介绍,结合渝
顾名思义,旧账指历史原因遗留下来的问题。旧账由于其形成周期较长、积存因素较多、解决起来较为困难,被称为“马蜂窝”,令人望而生畏、望而怯步、敬而远之,不敢去捅。$$当前,正值
报纸
坦克动力舱的结构和布置有多种型式,为了对不同结构的动力舱热工况的优劣进行对比、评价,必须用量化的指标加以衡量。提出了一种坦克动力舱热工况的评价指标体系,运用熵值法
目的了解三门峡市小学生近视患病率以及与健康教育是否相关,为更好地指导学校卫生工作和早期预防近视提供科学依据。方法按照卫生部《中国学校卫生情况年报表填报说明及技术
继“专车”之后,由各种互联网平台推出的拼车和顺风车再显群雄逐鹿之势。然而,这种全新组合的出行方式,在带来出行便利的同时,也隐藏着安全和法律纠纷方面的风险——不论是通过互
报纸
我国正在进行事业单位分类改革,国有林场面临重新界定的问题。国有林场对于我国生态、经济和社会实现协调、永续发展,构建和谐社会具有重要影响,但目前面临危困局面。该文阐
近数十年来民间文书的大规模发现与系统整理研究,不仅带动了学术研究的进展,为区域社会文化建设寻到历史文献依据,也为历史文献学学科发展奠定了坚实基础。整理归宗与分类编
以改善教学环境为目的,以改善室内声场环境为手段,通过分析室内声场及室内听闻环境的评价参数,指出以减小混响时间和均衡声压级分布为声学目标,合理运用吸声体与扩散体,合理
针对自动泊车系统(Automatic Parking System)中的路径规划问题,为实现不同泊车起始点的路径规划,提出一种基于两段圆弧的倒推式平行泊车路径规划方案,方案具有曲率连续及计
回顾了近几十年来国内外尤其是欧美等机械化发达国家在土壤机械压实危害方面的研究成果。土壤机械压实危害主要表现在土壤容积质量和机械阻力增加,大孔隙减少,土壤物理、化学