基于异常子图检测的特定行为群体发现

来源 :天津大学 | 被引量 : 0次 | 上传用户:davidchen19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着世界人口的快速增长,如何对人为造成的风险进行管控和预防一直是近几年来国际关注和亟待解决的问题。在大数据时代背景下,人的属性、特征得以信息化,由人的行为产生的数据在总量和维度上不断膨胀,为学者们研究人员风险计算提供了可能。本文从风险计算理论的角度出发,延伸了风险计算中在风险识别方向上的研究,将异常子图检测算法与特定行为群体检测问题相结合,对特定行为群体的发现展开了相关工作。本文主要研究内容如下:首先,设计了特定行为群体检测框架。该框架从互联网下载或爬取的原数据出发,通过一系列的算子以及群体画像的类图对数据进行处理、提炼和分析,最后输出一个演化的异常子图集合,该集合即表示检测出的特定行为群体。其次,提出了一种新的异常子图检测方法——动态网络中的多异常子图检测模型DE-MASS。DE-MASS模型作为特定行为群体检测框架中的核心步骤,能够在动态网络的时间片中检测出多个异常子图,从而直观地观察异常子图随时间的演化过程。通过对比实验发现,DE-MASS模型在微博事件检测数据集中相比于其他对比方法具有更高的真正类率(TPR)。最后,基于爬取的微博数据集对特定行为群体框架进行了实证分析。通过开发爬虫程序与爬虫平台原型系统,爬取到微博上2011年9月至2012年9月共20亿条发帖数据,并对2012年9月游行示威事件在微博群体间的传播过程进行了案例分析,验证了特定行为群体检测框架的有效性。综上,本文成功将异常子图检测算法与特定行为群体检测问题相结合,为发现特定行为群体提供了新的思路,提出的特定行为群体检测框架能为群体风险防控者提供有效的信息支持。
其他文献
<正>弘毅自强传承创新广西中医药大学将在自治区商务厅、中医药管理局等部门大力支持下,依托广西的区位优势、资源优势,以及学校学科、人才和科研优势,高标准建设好2馆2部2中心(中国-东盟传统医药综合馆、国医大师及名医名家馆、中医药教育培训部、国际交流服务部、大健康产品研发中心、高端中医特色医疗体验中心),从六个方面推进中医药服务出口基地建设:一是优化完善中医药人才培养模式,加强东盟国家中医药人才培养力
期刊
对于很多日常的感知运动的任务,例如步行和驾驶,为了完成这些任务,人们需要从周围环境中采集相应的视觉信息,而视觉扫描从中起着至关重要的作用。本文探究了在三维动态环境中执行感知运动任务时视觉扫描的机理。在虚拟驾驶环境下,利用眼动跟踪数据作为一种生物标志物来指征视觉眼肌运动行为。本文提出了一种新的视觉扫视效率度量,利用一种广为人知的信息论工具,Jensen-Shannon散度,将其定义为注视分布与光流分
学位
在大数据时代背景下,如何从零散且分散的数据中挖掘出人员的潜在行为模式从而计算人员风险,一直以来是研究的热点和难点。目前已有的工作大多都是仅仅通过人员的历史行为数据计算人员风险,但未给出造成异常行为的原因,且尚未有一套完整的针对人员行为风险计算的方法框架。本文利用实验室构建的风险计算框架RCF和频繁模式挖掘算法的相关理论,提出了一套模式挖掘检测框架,对人员的物理踪迹数据和电子踪迹数据进行挖掘并分析其
学位
报纸
随着大数据和互联网技术的发展,大量的知识图谱已经被开发出来。知识图谱上的知识推理旨在识别错误并从现有数据中推断出新结论。实体之间的新关系可以通过知识推理得出,以此来丰富知识图谱,然后支持上层应用程序。考虑到知识图谱的广泛应用前景,近年来对大规模知识图谱的知识推理硏究已成为自然语言处理的研究重点之一。规则、嵌入和神经网络都可以用于知识图谱推理,它们各有各的优缺点。本文首先提出了本体语义信息这个概念,
学位
<正>1.神经再生领域学科热点问题(1)神经调节和再生:包括神经细胞的再生、轴突再生和突触重塑等;(2)神经损伤和修复:包括脊髓损伤、中风、多发性硬化和神经变性疾病等;(3)分子和细胞机制:包括神经营养因子、生长因子、神经元和星形胶质细胞的分子和细胞机制等;(4)神经组织工程治疗:包括神经组织构建、细胞治疗、基因编辑治疗、生物工程、神经假体等治疗中枢及周围神经系统疾病;
期刊
随着信息技术和多媒体技术的快速发展,多标签分类由于在多媒体图像标注、社交网络数据挖掘、影像标注等多个场景有广泛的应用,已经逐渐成为一个重要的研究课题。不同于单标签分类任务中每个样本只对应一个标签,多标签分类任务中每个样本可以与一组标签关联,需要输出多个标签信息。尽管在多标签学习任务上,多年来已经取得了一些进展,但是目前仍然存在许多困难。由于多标签实例中标签通常是有关联的,因此,如何学习和捕获多个标
学位
近年来增强现实(Augumented Reality,缩写为AR)技术飞快发展,第一人称视角下的交互识别(Egocentric Action Recognition,缩写为EAR)在应用场景中可以用于理解用户行为,更好地选择响应行为。但是,该任务中的输入只涵盖了部分场景信息,在涉及到多人之间的交互场景时,捕获到完整的场景信息更有利于分辨用户的意图和理解用户的行为。成对第一人称视角下的交互识别(Pa
学位
以石油烃污染土壤为研究对象,选择十二烷基硫酸钠(SDS)、十二烷基苯磺酸钠(SDBS)和聚氧乙烯失水山梨单油酸酯(Tween80)3种表面活性剂,通过批试验,考察3种活性剂单独使用及不同复配类型对土壤中石油污染物的增溶效果,并开展效果分析和适宜性评价。结果表明:(1)SDBS、SDS和Tween80对污染土壤中石油烃增溶作用的最佳浓度分别为6、10和15 g·L-1,最佳固液比分别为1:15、1:
期刊
网络表征学习,或称作网络嵌入,其目的是将网络投射到一个低维空间中,利用这些节点学习获得的表征向量完成不同的网络分析任务,如节点分类、节点聚类、社区检测、链接预测、推荐系统等。近年来,许多学者关注到了静态网络表征学习方法,其中主要包括基于随机游走的方法,基于矩阵分解的方法和基于深度学习的方法。这些针对静态网络的表征学习方法通常将某一时刻网络的固定结构作为研究对象,来得到该网络的节点在低维空间中的表示
学位