基于深度学习的社交网络跨媒体突发事件检测与搜索研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:cbiba123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的蓬勃发展,社交网络大数据以丰富的跨媒体形式呈现出巨大的增长趋势。由于发布的消息具有快速传播和广泛共享的特点,社交网络跨媒体大数据揭示了大量真实的社会现象,蕴含了海量有价值的突发事件。因此,为了满足大量用户和组织者对突发事件有效管理和形式分析的需求,针对社交网络展开突发事件检测与搜索的研究具有重要的价值和意义。然而,社交网络突发事件中消息的描述形式具有一定的随意性和语义稀疏性,跨媒体数据之间存在着特征空间异构等特点,使得在社交网络大数据中进行突发事件检测与搜索面临着极大的挑战。本文围绕社交网络突发事件检测与搜索问题,对基于社交网络多属性特征的突发事件语义获取与表达、基于深度语义哈希的社交网络突发事件语义分析以及基于多视角图注意力网络的社交网络跨媒体突发事件检测与搜索等关键理论与技术进行了研究。本文取得的主要研究成果如下:(1)针对社交网络跨媒体数据中信息稀疏以及现有方法没有充分挖掘数据之间的关联关系和扩展语义的问题,提出了基于社交网络多属性特征的突发事件语义获取与表达方法,包括基于社交与概念化扩展的短文本语义获取与表达算法(SCSE)和基于标签异构图模型的图像语义获取与表达算法(HHGM)。在短文本方面,SCSE算法基于外部知识库获取短文本显性语义,通过融合话题标签和链接信息等社交网络多属性特征构建社交与概念化语义图模型,挖掘短文本之间潜在的语义相关性。基于社交与概念化语义信息对短文本扩展,在一定程度上克服了突发事件文本数据的语义稀疏性,获取了短文本显隐性扩展的语义特征表示。在图像方面,HHGM算法通过在图像数据中引入话题标签,构建了异构的社交网络图模型,实现了对图像之间语义关联的分析。基于图卷积神经网络的邻居聚合特性,通过关联标签对图像语义进行补充和学习,获取了具有丰富语义表示的图像特征。实验结果表明,提出的SCSE与HHGM算法在社交网络短文本和图像语义的获取与表达中,能够有效地缓解社交网络多模态数据的稀疏性,具有较好的语义获取与表达性能。(2)针对现有的社交网络突发事件语义分析方法在深度语义特征学习和分析中很难克服自身的语义局限性,导致突发事件检测和搜索效果较差的问题,提出了基于双重语义扩展与深度哈希模型的短文本语义分析算法(SCSE-DH),实现高效的突发事件检测和搜索。在提出的SCSE算法的基础上,建立了深度哈希模型,在双重语义扩展后的短文本中进行深度语义特征分析和学习,获得了社交网络短文本蕴意丰富、表示精炼的语义分析结果。基于堆栈式自编码器与语义哈希网络的联合训练学习,有效地捕获和压缩了短文本的内部语义,通过逐层降维保留了短文本的语义信息。基于深度语义哈希特征进行事件检测和搜索,取得了显著的效果。实验表明提出的SCSE-DH算法在短文本语义分析中以及在突发事件检测和搜索任务中的有效性。(3)针对现有的突发事件检测与搜索研究仅面向单一特征进行学习,导致重要信息缺失或对跨媒体信息无法有效融合的问题,提出了基于时间信息指导的多视角图注意力网络模型(T-MVGAN)。建立了社交网络突发事件的多视角模型,在文本、图像和时间因素三个方面对突发事件进行全面综合表示,实现了社交网络跨媒体突发事件特征之间的互补和关联。构建了社交网络跨媒体突发事件异构图模型,基于提出的HHGM算法获取图像语义特征,在文本异构图模型中,学习短文本的语义特征和时间分布特征。建立时间分布信息引导的多视角图注意力网络,将时间特征作为社交网络跨媒体数据之间的共识信息和关联桥梁,对文本和图像特征进行融合,获得了社交网络跨媒体突发事件的有效表示,实现了突发事件检测和搜索。实验表明,T-MVGAN模型能够获得社交网络跨媒体突发事件丰富的特征表示,具有较好的社交网络突发事件检测与搜索的性能。(4)综合提出的基于社交与概念化扩展的短文本语义获取与表达算法(SCSE)、基于标签异构图模型的图像语义获取与表达算法(HHGM)、基于双重语义扩展与深度哈希模型的短文本语义分析算法(SCSE-DH)与基于时间信息指导的多视角图注意力网络模型(T-MVGAN),实现了基于深度学习的社交网络跨媒体突发事件检测与搜索系统,包含社交网络突发事件语义获取与表达模块、社交网络突发事件深度语义分析模块、跨媒体突发事件检测与搜索模块。该系统对本文提出的算法进行了性能的评估和结果展示。社交网络跨媒体突发事件检测与搜索模块分别针对突发事件检测与突发事件搜索两种任务,给出了指定时间段内发生的社交网络跨媒体突发事件的结果以及给定查询内容下的社交网络跨媒体突发事件的搜索结果。该系统验证了本文提出的算法的有效性。
其他文献
申万宏源证券深入学习习近平新时代中国特色社会主义思想,按照中投公司提出的打造有信仰、有担当的国有金融企业的要求,守理想信念之正,出创新转型之奇,以敢于担当的精神尽国有金融企业之责,以良好的文化积淀护航企业规范经营,努力走出一条迈向现代投资银行的转型之路。
随着市场竞争的日益激烈,组织环境的动态性越来越高,团队成为一种重要的企业组织形式,以其有效性和灵活性使企业能够更好地适应复杂多变的市场环境。然而在团队中,却时常会出现管理者与团队成员之间的“反馈真空”状态。一方面,上级没有意识到反馈信息对于员工发展的重要性;另一方面,员工认为上级提供的反馈信息对于提高自身绩效和能力没有实际价值。单纯依靠自上而下的反馈已经难以满足员工
随着国家对复合生态系统运行状态的持续关注,以及综合评价领域研究的推进与完善,复合生态系统评价的相关理论与方法已被应用于多个领域。其中,区域复合生态系统发展质量评价研究是复合生态系统评价的核心研究内容,同时也是对传统综合评价理论、方法的自然拓展。目前,与区域复合生态系统发展质量评价相关的研究已取得了较多成果。然而,在面向更为复杂的情境时,仍有一定的局限性,主要体现在以
随着清洁能源在全世界发展日益迅速,风力发电产业也获得飞速发展的机会,风电场的规模也变得越来越大,风机装机数量直线上升,一些风机装机时间较早,故障出现的次数也会增多,发电效率也会下降。风机上的监控与数据采集系统会在风机运行时产生大量数据,其中包含了风机运行的大量信息,如何充分挖掘和运用这些SCADA系统记录的有价值的数据,减少风机故障率、提高风电机组运行的可靠性具有重要的现实意义和应用价值。本文首先
目的:建立HPLC法测定二甲双胍格列本脲片(Ⅱ)中格列本脲的有关物质。方法:色谱柱为C_8柱(250mm×4.6mm,5μm),流动相A为pH3.5的磷酸二氢铵溶液(取磷酸二氢铵1.725g,加水300mL溶解,用磷酸调节pH至3.5±0.05),流动相B为乙腈,梯度洗脱,流速为1.0mL·min~(-1),柱温为40℃,检测波长为230nm。结果:格列本脲与已知杂
随着互联网的普及和网络质量的提高,互联网多媒体通信技术得到了迅猛而广泛的发展。网络电话和网络视频已经在改变人们的生活方式。在这样的大环境下,IETF制定的SIP协议,SIP是Session Initiation Protocol的简称,翻译成中文为会话初始化协议。该协议具有实现简单、扩展性好,具有强大的用户查找和定位能力,以及与现有Intemet联系紧密,而获得广泛的应用。现在的IP电话系统大部分
学位
本文采用锡粉、硝酸、氨水为原料,用水热法制备了纳米SnO2粉体,并用XRD、SEM等手段对纳米SnO2粉体进行了表征。XRD和SEM分析表明,水热法制备的SnO2粉体为纳米级,晶粒的平均尺寸大小约为5nm。对水热反应时间分别为3h、9h、13h得到的粉体进行了XRD测试,测得粉体的粒径分别为4.1nm、4.4nm和5.0nm。  将粉体制作成了厚膜气敏元件,并对厚膜工艺进行了研究。确定了纳米粉体的
  本论文主要研究的工作是以AVS—M标准为基础,应用差错复原编码以提高差错复原性能,对差错编码技术进行了研究,根据实际网络传输可能发生的问题,提出了比较适合在无线网络上视频传输的差错复原编码方案,仿真实验表明,本论文提出的差错复原编码方案在发生传输差错的情况下能够有效地提高重建图像的质量。
学位
小学语文是培养学生人文素养与学识知识的重要阶段,在这个阶段下,学生正处于学识启蒙阶段,对事物的模仿能力强,加上周围环境的影响,是学生养成文明习惯的黄金时间段。小学班主任作为学生的直接管理者和负责人,要切合小学生心理发展规律,认真贯彻教学管理思想,教导学生基础的文化知识与正确的人生态度,使学生树立正确的人生观。本文旨在分析小学语文教学中管理中与班主任责任工作相结合下的
学校代码10530学号201590070035分类号D925.2密级公开博士学位论文“调查-起诉”关系研究——以职务犯罪为视
学位