微博话题演化追踪算法的设计与实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:baobeizhu66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息技术的快速发展与进步,论坛、微博等新兴媒体已经成为人们获取信息的主要渠道。尤其是近些年来,微博凭借其便捷性以及独特且强大的传播机制,得到了用户的广泛参与,并迅速发展成为基于用户关系的信息分享、传播及获取平台。其中,微博话题就是一种重要的用户参与方式。它根据微博热点、个人兴趣、网友讨论等多种渠道的内容,经过话题主持人补充修饰和加以编辑的,与某个话题词有关的专题页面。微博用户可以进入该页面发表微博进行讨论,同时话题页面也会自动收录含有该话题词的相关微博。微博话题是反映用户个人偏好、发现用户行为习惯的一种重要途径,所以,微博话题演化的追踪在用户兴趣发现、谣言检测、舆情追踪等多个领域都具有重要的研究价值。因此,如何从微博中获取话题并对话题演化进行追踪成为迫切需要解决的问题。但微博话题的追踪具有固有的难点。其中,它文本较短,词频较低给话题检测带(?)很大的困难;其次,在话题对齐、话题相似度度量、话题强度度量等诸多问题为在时间序列上,对微博话题进行话题演化的追踪带来了诸多挑战。因此,为了解决上述问题,我们拟采用下面的方法:首先,本文引入Biterm T eModel(简称BTM)来处理微博数据。BTM是一个话题分析的聚类模型,它(?)处理短文本的话题分类具有优势;其次,为了实现话题演化的追踪,本文引入在线LDA 模型(Online Latent Dirichlet Allocation,简称 OLDA)中演化矩阵的概念,对BTM进行扩展得到在线BTM(简称OBTM);然后,使用OBTM对时间片上的文本进行建模,从而获取话题。最后,使用演化矩阵对话题演化进行分析,并通过Jensen-Shannon散度和讨论度两个指标对话题相似度和强度进行度量。实验证明,本文提出的OBTM对微博话题的演化追踪方面,具有高效性和准确性。
其他文献
<正>1.问题的提出普通高中课程标准实验教科书《人教版》认为乙醇能够被酸性重铬酸钾溶液氧化产物为乙酸,同时给出了实验过程的彩图,但是反应过程的原理,实验现象的细节则没
<正>应对非洲猪瘟各省积极防控8月30日至31日,湖南省兽医局在长沙举办了260人参加的2018年全省动物防疫培训班,负责人对省内非洲猪瘟的防控进行了周密部署。要做好以下七项重
《德伯家的苔丝》是英国著名批评主义小说家托马斯·哈代在英国文学史上最负盛名的悲剧小说之一。该书被出版于1891年,自发行之日起便被来自不同角度的不同理论讨论研究,并且
鉴于我国金融体系发展尚不完善,目前在借贷体系中仍旧是商业银行占据主导地位,很多小微企业或者低收入群体难以获得金融贷款,便转向P2P等网络金融寻求融资机会。P2P网络金融
目 的 : 研 究 高 强 度 聚 焦 超 声 ( high intensity focused ultrasound,HIFU)治疗大鼠骨肉瘤后外周血中γδT 细胞的变化及该变化的时间规律,并探讨该变化是否与 HIFU
目的:研究化疗方案顺铂(DDP)+盖诺(NVB)不同间隔时间联合放射治疗对人乳腺癌MCF-7细胞辐射敏感性及细胞凋亡的影响。 方法:采用细胞集落形成方法,观察DDP+NVB方案不同间隔
自二十世纪中期以来,以互联网为载体的现代信息网络技术逐步将人类带入网络时代,并且迅速蔓延至人类生产生活的方方面面。网络技术的兴起与壮大,虽然为当代大学生的生活学习
社区问题是当前国际保护地领域关注的重点,也是我国风景区和自然保护区管理面临的难题,传统“排除式”的规划与管理思维,在目前社会与经济快速发展的背景下显现出诸多问题。
民营上市企业的资金问题是影响企业发展乃至生存的至关重要的问题,目前传统融资方式已不能满足企业的资金需求,因此对于融资方式创新的研究将会有效缓解企业目前存在的资金问
本文就米粉工艺、米粉生产的机械化程度、米粉方便化趋势及米粉范围的日趋扩大作了比较详细的分析,尤其对波纹米粉、排米粉、方便河粉的生产进行了比较深入的研究,对米粉方便化