跨媒体话题检测与跟踪方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:pluto529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的不断发展和社交媒体的流行,当前媒体社会进入到“自媒体”时代。在自媒体时代,人人都是信息的传播者以及推动事件发展的主要力量,这就使得网络信息传播速度更快,受众更广,内容更加丰富。近年来大量研究者投入到基于内容的跨媒体多模态信息管理的研究工作,基于多模态信息的跨媒体话题检测与跟踪成为其中重要的一部分。但是具有明显差异性的跨媒体数据和具有多样性的网络话题使跨媒体话题检测和跟踪非常具有挑战性。  在本论文中,我们充分考虑跨媒体多模态数据特征差别大、结构不整齐的特点,将跨媒体数据包含的异质多模态信息抽象为图模型,对不同模态数据分别构建单模态图,并综合考虑话题本身的多粒度性,利用无监督的图聚类方法进行跨媒体话题检测。同时,针对话题数据的特点提出两层密集子图恢复的思路进行话题跟踪。本文的主要研究内容和核心贡献如下:  (1)针对缺少数据集的问题,本文构建了专门针对跨媒体话题检测与跟踪任务的数据集。现阶段话题检测与跟踪研究内容主要集中在新闻博客等文本信息或者网络视频内容,同时包含来自不同媒体源的多模态信息的数据集较少。我们针对跨媒体话题检测与跟踪任务,提取了与该任务相关的文本、视觉信息的特征,并对数据集的所包含的社会话题进行了人工标注,构建了可供跨媒体话题检测与跟踪算法进行实验验证的数据集,。  (2)针对跨媒体话题检测问题,本文提出了一种基于多模态信息融合的跨媒体话题检测方法。该方法从多模态信息融合入手,将不同模态的数据抽象为图模型,对每种模态都建立单独的图结构,并通过加入空节点,解决了数据模态缺失的问题,使所有模态的数据均具有相同的图结构,然后利用集合相似度代替原数据相似度,用来应对不同模态信息的异质问题,使得异质图能够转化为同质图,便于进行数据融合。利用我们的多模态融合框架,只需要简单的引入一个单模态图,便可以加入其他可以带来增益的信息,提高检测性能。  (3)针对跨媒体话题跟踪过程中话题主题漂移现象以及数据稀疏问题,本文提出了一种基于密集子图恢复的话题跟踪方法。话题跟踪可以看作是话题的连续检测,所以我们首先按照时间顺序划分时间轴得到时间片段,对不同时间段的数据分别建图,并检测各个时间片段内的事件。然后对相邻时间片段的密集模式,根据其内容的关联性建立局部矩阵并进行密集子图恢复,将具有强内容相关性的事件串联。最后按照时间线,串联各个时间片段相关的密集子图,得到最终的话题。  总体而言,本文的工作围绕跨媒体的多模态数据融合展开,综合考虑话题检测和跟踪的任务特性,提出了有效进行跨媒体话题检测与跟踪的方法。  
其他文献
中国土地估价业务起步于80年代末期,90年代中期才得以发展.在土地估价研究中,中国充分借鉴了发达国家一些成功的经验和方法,研究出符合中国国情的评估方法,建立了较为完善的
多agent系统的组织方式问题:该文提出了群体agent的逻辑"域"结构,适应开放的多agent环境动态变化的要求,构造了一种新的基于域的动态自组织模式.协调过程限定在不同粒度的域
该文首先介绍了answer set planning的理论基础和研究现状,以及动作理论界对衍生问题的研究情况;然后定义了一个基于高级动作语言C、通过用因果关系描述的领域约束确定动作的
针对传统面向对象、面向过程软件开发方法过程中计算机专家和领域专家知识没有分离导致不能开发出高水平的软件的问题,进一步研究了面向规范的软件开发方法.在基于面向规范的
如何让机器从大量感知数据中抽取高层的数据表示是人工智能领域的核心问题,理论和生物学言论强烈建议,构建这样的智能系统需要深度模型,而传统深度模型的训练不仅容易陷入局部最
数字通信和移动通信是当今全球发展最快的行业。随着Internet的迅猛发展,手机、掌中宝等无线通讯设备的普及,人们对无线上网的要求越来越强烈了,都希望无论在何时、何地,只要需要
裂缝参数的提取是FMI成像测井解释的重要环节之一.目前,从成像测井中识别裂缝主要通过人眼完成,裂缝参数的计算也是通过人工给出裂缝关键点通过计算机自动拟合来实现的.实现
随着计算机技术的发展以及用户对于存储需求的日益增长,主动存储系统成为热点研究。如何利用未来存储设备上的计算能力来支持高性能的计算和高效的存储访问成为问题的关键。本
该文试图提出一套完整的基于多Agent协商的机制来解决组合拍卖的问题.该文中详细介绍各种组合拍卖的竞价语言并分析了它们的表达能力.在OR语言的基础上,该文形式化定义了组合
Web服务是电子商务领域具有革命性的技术,它以XML,HTTP等开放的规范为基础,以SOAP,WSDL,UDDI为核心,在现有的各种异构平台的基础上构筑一个通用的平台无关、语言无关的技术层