社交媒体跨平台信息检索和事件预测方法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:aklehigh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体的发展改变了用户理解和跟踪现实世界中的事件的方式。在社交媒体上,用户可以上传并分享与这些这些事件相关的内容,例如文本、图像、视频等多种模态的信息。大量的信息分布在各种各样的在线社交网络上,社交网络提供了丰富的、有广泛覆盖度的、全面的有关流行事件的信息。本文利用这些信息,提出了社交媒体跨平台信息检索和事件预测方法的框架。面对着如此大量的信息,搜索成为了事件理解和跟踪的一个方便的工具。然而,目前的单平台的社交媒体搜索往往仅针对单个平台上单种模态的信息。不仅如此,大多数的社交媒体仅仅展示了事件的某一个有偏的角度,这严重的限制了基于单个平台的搜索的覆盖度和多样性。本文提出了一个创新的跨平台的框架来整合这些跨网络的针对一个事件的信息,在信息检索领域提供了一种浸入式的搜索体验。由于社交媒体信息的跨网络分布特性,这些异构的社交网络之间存在着语义上的鸿沟,因而本文提出了使用标签以及哈希标签来作为桥梁,连接这些异构的社交网络。标签和哈希标签是很多社交平台使用的用户产生的元数据,这些元数据常常被用来进行组织和标记。本文提出了一种四个步骤的框架,框架中使用了多种方法来进行哈希标签和标签的过滤以及搜索结果的表示,聚类和表达。给出一个搜索词,第一个步骤获取了社交媒体上的信息以及相应的哈希标签和标签,并且将所需要的合适的哈希标签与标签过滤出来。第二个步骤和第三个步骤分别对这些哈希标签和标签进行了主题的表示和聚类。最后一个步骤将搜索结果组织为一个分层式的表达。本文的框架在一个大量搜索词构成的数据集上进行了定性和定量的分析,展示了其有效性。面对多平台的信息分布,进行信息的预测成为了研究者们关注的重点。新闻平台通常来说提供严肃的,客观的信息,社交媒体则如上所述,记录并传播社会事件相关信息并且实时的主观的讨论社会事件。基于平台间的互补信息,本文提出了跨平台社会事件的主题预测任务。本文从新闻媒体和社交媒体分别收集了社会事件相关的事件,按照时间将信息分割成时间切片序列,用平行的时间窗口在不同的平台上滑动,构建了序列的平行数据集。这些时间切片也由主题建模的方案给出的主题空间生成每个切片的主题分布和嵌入,平行数据集被应用于序列到序列模型(Sequence-to-Sequence,Seq2Seq)来训练出跨平台主题预测模型,相应的实验也说明了本文方案的有效性。
其他文献
目的:运用DTI技术通过基于解剖图谱的分析(atlas-based analysis,ABA)方法探究终末期肾病(end stage renal disease,ESRD)伴睡眠障碍(sleep disorder,SD)并长期进行维持性血
目的:探讨脓毒症合并肝功能障碍患者血清肉碱谱的浓度与肝功能障碍程度、病情严重程度及最终预后转归的相关性。方法:采用回顾性观察研究的方法,收集2015年9月至2018年12月期
古籍文献具有重要的历史和学术研究价值,不同版本的古籍文献中文字的差异性比较是古籍文献与古籍汉字相关研究的重要内容。传统的人工比对方式效率低、准确性差。随着信息技
视网膜血管是人体唯一可以无创伤直接观察的较深层微血管,是许多眼底疾病如青光眼等以及系统性疾病如糖尿病视网膜病变、高血压等的观察窗口。眼底彩照技术是眼科临床常用的
土壤盐渍化是影响林业可持续发展及生态环境建设的重要限制因素之一。盐胁迫对植物的伤害主要是由于土壤中高浓度盐离子(特别是Na+)引起,过多的Na+进入植物体内导致离子失衡和
在临床诊断与医学研究中,血管是十分重要的生物组织。视网膜血管是人体仅有的能直接进行观察的血管网络,作为眼底图像的重要特征,其结构和形态的改变与高血压、糖尿病、动脉
近年来,随着机器学习技术的飞速发展,人脸识别在准确度和速率等方面有了很大突破,一些最新的研究成果,如FaceNet、DeepFace、DeepID等,其准确率已经接近甚至超过了人类识别的
端到端的基于神经网络的方法是目前图像标题(Image Caption)任务的主流方法。目前大部分研究都集中于单一语言(如英文)的图像标题研究,并取得了很好的性能。但是在很多时候,
随着互联网技术不断发展,学术成果不断涌现,学者们可以使用各种分析方法来挖掘学术成果之间的隐藏关系,并探索学术合作的规律。其中,学术合作关系的分析逐渐成为研究热点,对
目的:c-Maf在50%以上的多发性骨髓瘤(Multiple myeloma,MM)细胞中高表达,通过其下游靶基因及与其他信号因子的相互作用促进MM的发生和恶性进展,与MM的化学耐药、临床恶变和不良预后密切关联。我们前期研究表明,去泛素化酶USP5通过稳定c-Maf蛋白从而促进MM细胞增殖和存活,表明USP5/c-Maf轴可能成为多发性骨髓瘤治疗的潜在靶点。本文建立了一个基于USP5/c-Maf的