面向在线社交网络的话题演化关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:tonycheungqd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社交网络是将现实社会中个体与个体、个体与群体、群体与群体间的相互关联,映射至互联网上而形成的虚拟社会网络。随着信息技术和互联网的快速发展,在线社交网络已经成为人们获取信息、表达观点、发表意见的重要途径。人们通常会在社交网络平台上对当下现实社会中发生的事件发起讨论,通过发布言论、评论事件、转发扩散等多种形式抒发个人或群体的观点和态度,而这一系列讨论通常会在社交网络上形成某个或多个特定话题。随着时间的推移、事件的发酵、参与讨论的用户数目和信息内容的迅急增长,用户对于特定事件讨论的内容会相应发生改变,其对应的话题也会发生演化。然而,部分话题的演化可能会改变人们的认知,形成的舆论形势反作用于真实世界,影响事态的进一步发展。更有甚者,部分话题内容最终演变为对于社会不公的抱怨以及对政府公信力、执行力的怀疑,危害着国家与社会安全。因此,社交网络话题演化研究对于及时掌握民众动态、控制舆论的发展和维护国家安全稳定具有十分重要的理论意义和现实意义。如何形式化表示演化的话题、分析话题演化的诱因、衡量话题演化的强度、追踪话题演化的内容是本文的核心内容。本文以话题演化为研究点,分别从演化的表示——话题表示模型,演化的诱因——用户兴趣,演化的强度——话题流行度,演化的内容——话题关注点等四个方面展开研究,主要贡献如下:(1)在话题表示模型方面,传统的向量空间模型不能很好地处理词汇间一词多义、同义词等语义问题,而新兴概率模型的话题结果没有考虑词汇分布的均匀度,不适合话题关键词抽取等应用场景。针对这种情况,本文提出一个基于信息熵和LDA模型的话题表示模型,结合LDA模型和信息熵探究话题表示的区分性和代表性问题。在此基础上,将行为类型分析加入到词汇内部权重讨论,提出了融合行为类型的话题表示模型。基于新浪微博的实验表明,本文提出的话题表示模型具有更好地区分性和代表性,更符合话题表示模型的实际应用场景。(2)在用户兴趣挖掘方面,传统的用户兴趣分析方法是基于文本挖掘技术获取用户的兴趣,但这种方法取得的兴趣结果通常具有可解释性较差的特点,无法直接将兴趣展示给用户。在线社交网络中的行为交互关系是以信息为承载,对于分析用户兴趣有着很大帮助。针对这种情况,本文提出了一种基于标签和双向传播的用户兴趣挖掘方法。该方法建立在标签的基础上,因为标签通常是用户自己标注或创建的,具有更好的解释性。基于新浪微博数据分别讨论了不同交互数量下的标签情况,发现正向传播对于标签传播的影响更大,与基于传统挖掘技术的兴趣分析方法的对比实验验证了该方法在性能上的提升。(3)在话题流行度演化方面,传统方法大多是分析信息流行度的前期和后期关联或者是预测确切数值,但实际场景中更关注话题是否流行,而不是其确切流行数值。针对这种情况,本文提出了一个基于相似关系和共现关系的话题流行度预测方法。该方法给出微博中流行度的定义,并将流行度划分为四个不同流行等级,结合话题间的相似关系和共现关系完成流行度的预测。以新浪微博的信息为对象设计实验,结果证明了预测方法的有效性。(4)在话题关注点演化方面,现有的大多数话题关注点演化方法都是基于时间片这个粗粒度且采用的是时间片内发布的文档作为处理对象,没有针对特定时间点的细粒度话题关注点演化方法,而特定时间点粒度的分析如果只处理该时间点发布的文档是不现实的,因为这个时间点可能只发布较少文档甚至没有文档发布。针对这种情况,本文提出基于密度估计的话题关注点演化分析方法,认为在特定时间点之前的文档对于该时间点同样存在影响。同时还提出了基于密度估计的话题关注点演化分析框架。实验表明,分析框架可以很大程度上提升关注点的分析效率。综上所述,本文研究了社交网络中话题表示模型、用户个体兴趣挖掘、话题流行度预测和话题关注点演化分析等关键技术,在真实数据集上的实验验证了提出方法的可行性,对于社交网络的话题演化研究具有一定的理论意义和应用价值。
其他文献
21世纪以来,我国高等教育大众化进程不断加快,众多高等院校紧跟教育发展步伐进行扩招,大学生数量与日俱增,相应的高校教师数量也在不断增加。高校青年教师作为高校教师队伍的主力军,其专业水平、职业素养、师德师风直接影响着我国高等教育事业的健康发展和学生的成长成才,作为高校青年教师队伍建设的主要方式,高校职后教育不可或缺。本文在理论研究、实证分析以及文献查阅的基础上,首先,分析了大学精神文化、制度文化、行
随着移动网络技术的发展和智能终端的普及,在无线网络中传输大规模数据比如视频直播等需求已经成为人们日常生活中不可或缺的一部分。除了使用移动网络会耗费大量的流量资源
目的:1.探讨预防胃癌术后患者口腔感染,改善口腔卫生状况,促进患者舒适的口腔护理方法。2.践行“加速康复外科(ERAS)”的促进患者术后康复的理念,探讨促进胃癌术后患者早期活动及术后康复的方法。3.评价胃癌患者自我护理能力。4.以患者为中心,评价基于Orem自理理论的口腔护理对胃癌术后患者自我护理能力及舒适度的影响,探讨提高患者自我护理能力及舒适度的方法。方法:选择2018年3月至2018年11月
<正>评估设备:圆纬机纬编无缝内衣机袜机电脑横机经编机(含经编用整经机)针织钩编机本次展会共有来自德国、日本、意大利等国家和地区的115家厂商参展,展出不同种类的针织机
根据北京市 2 0 0 8年率先基本实现现代化、2 0 2 0年基本建成现代化国际大都市、2 0 5 0年建成世界一流水平的国际大都市的“新三步走”战略 ,采用国家计划生育委员会开发的
防震减灾要从孩子抓起,学校是防震减灾的主阵地,通过学生影响家庭,影响社会。在学校开展防震减灾宣传教育可以增强每个家庭的防震减灾意识,提高防震减灾技能。学校防震减灾工
通过对加筋土挡墙大型模型试验土压力测试分析,提出加筋土挡墙的土压力系数应区分为填土自重土压力系数和超载土压力系数.自重土压力系数在墙顶为主动土压力系数,至墙底为静
近年来,随着信息通信技术的飞速发展,人们的生活越来越离不开网络,各种网络电子数据充斥人们生活的方方面面。在给人们的生活带来无数便利的同时,也为各国的刑事侦查机关获取证据带来了新的挑战。由于技术的发展,互联网络的全球性,使得跨境存储电子数据不再是问题,侦查机关不得不面临犯罪数据全球化的问题。越来越多的证据存储在云端,往往还存储在境外不同的国家,为了获得这些数据,执法机构需要从远程服务器上调取电子数据
随着电子技术的高速发展,人们的生活也随之发生了很大的变化,“绿色、智能”化越来越多的进入到我们的生活,变成了人们的追求。利用现代电子技术实现智能化管理已成为必然的发展趋势。目前学校大部分采用的仍为传统的照明控制方式,无论是否有人、人多人少,都可能出现灯光全开的现象。通过市场调查研究,现有的智能型教室灯光控制系统也存在着一些问题,例如布设线路复杂,灯具使用寿命短,舒适度差等。鉴于上述问题,研究设计了
水泥工业是我国重要的材料工业构成之一,2007年重组,自重组后此行业孤掌难鸣,该怎样加强内部管理?把开展业务、企业管理、财务制度等综合管理,达到职能部门的协调工作,提高企