基于知识嵌入主题模型的多模态社会事件分析

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:lishuangjie2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网和社交网络的发展,人们的生活方式也在发生变化,许多社交网站(如Facebook,YouTube和微信)如雨后春笋般涌现,导致出现各种社会事件的大量多媒体数据(如文字,图片和视频)。并且伴随着互联网上数据的积累和特征表示学习技术的进步,从大规模知识库中学到的知识嵌入也已被用于概率主题模型。本文的目标是从大量无序的社交媒体数据中高效挖掘出事件主题,从而有利于用户或政府对重大社会事件的搜索、浏览和监控。然而,基于多模态信息学习可解释的主题和判别性事件表示是非常具有挑战性的。(1)本文首先提出了一种用于社会事件分析的基于知识的多模态加权主题模型(Knowledge-based Multi-modal Weighted Topic Model,KBMMWTM)。提出的KBMMWTM模型具有以下优点:1)提出的KBMMWTM模型可以有效地利用社会事件数据的多模态性;2)提出的KBMMWTM模型利用数据集中的词相关性作为先验知识,可以提高事件主题挖掘的性能。最后,我们在真实数据集上评估了我们的KBMMWTM模型,完整的实验表明我们的模型优于最先进的模型。(2)紧接着本文又提出了一种用于多模态社会事件分析的基于知识嵌入的主题模型,记作KE-MMTM(Knowledge Embedding Based Multi-modal Topic Model)。与其他现有方法相比,我们的工作有三个主要优势:1)我们的模型可以将附加的知识图嵌入作为先验知识集成到统一的主题模型中,利用知识嵌入,最大间隔分类器和多模态信息来获得更多的事件描述;2)我们使用WN18知识库(包含151,442个三元组,40,943个实体和18个关系)来学习知识嵌入向量,然后将具有由这些实体向量编码的先验知识的多模态数据合并到主题模型中从而学习更一致的主题;3)为了用于事件主题挖掘和分类研究,本文收集并公开发布了大规模多模态数据集(包括10个事件,每个事件包含约7000条信息)。大量的实验表明,所提出的方法在主题一致性方面优于(具有83.2%的分类准确度)现有的模型。
其他文献
<正>~~
期刊
据“European Plastics News,2007,34(7):34”报道,瑞典Xylan公司开发出阻隔性生物降解薄膜Xylophane,这种阻氧性薄膜是以玉米、麦秸或木材加工的副产品为原料制备的产品。Xylan公司
X13-CCW复合型外墙涂料的主要基料为硅溶胶,其胶体中水份蒸发时,胶粒因自身活性与聚集性发生脱水缩合反应,形成网状结构,并通过渗透与硅酸钙、碳酸钙发生硬化反应,对基层的粘
目前碎石桩加固液化地基,其桩长一般穿透液化土层,本文通过地震时复合地基中超静定孔隙水压力的分布,认为在上部荷载和碎石桩排水作用的影响下,适当的预留一定厚度的液化土层也可
日前,由中国建筑科学研究院工程抗震研究所为主要承担单位完成的《首都圈大型公共建筑抗震加固改造综合技术研发与工程实践》课题获得建设部颁发的2004年“中联重科杯”华夏建
本文介绍了865内墙涂料研制的原理,原料规格、生产工艺、涂料的技术性能指标等,说明了以来原丰富的淀份为主要成膜物质生产该涂料不仅解决了原料紧缺和价高的问题,而且质量优
在综合分析聚乙烯醇系复合建筑涂料的性能及生产工艺的基础上,提出了新的配制工艺及原料配方,制成了JX-908涂料。本文介绍了该涂料料的组成、性能、配方和生产工艺。
1 全球地震活动概况2001年全球发生7级以上地震23次(2000年为21次),其中8级以上地震2次,最大地震是2001年11月14日发生在我国昆仑山的8.1级(2000年最大地震为7.8级)地震(图1,