恐怖行为预测中特征提取与类不平衡问题研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:inKin9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文化建模的发展,背景知识开始用于预测组织的恐怖行为。组织采取的恐怖行为往往受组织相关的背景知识影响,因此,利用与组织相关的背景知识预测恐怖行为,可以提高预测的准确率。目前,基于背景知识的恐怖行为预测算法研究大多还局限在恐怖行为数据集中属性完整的情况,然而,由于恐怖行为很少发生,很多信息难以获得,背景向量中的部分属性常会出现残缺。此外,大多数预测算法在所有属性都完整的情况下效果较好,当部分属性缺失时,就严重依赖于补充残缺属性的预处理技术,不仅增加了时间复杂度,而且也降低了算法的预测精度。另外,恐怖行为数据集中存在严重的类不平衡问题,严重影响了分类器对恐怖行为的分类效果。  因此,本文针对恐怖行为数据集的特点,对各种特征降维算法进行分析和研究,提出了基于最大化背景向量与行为之间依赖关系的特征提取方法,解决了属性残缺对预测的影响。针对数据的类不平衡性对预测造成的影响,提出了改进的SVM恐怖行为预测算法。论文的主要内容如下:  (1)提出了压缩背景空间算法(Compressed Context Space,CCS)。CCS算法基于希尔伯特。施密特独立标准和希尔伯特-施密特范数,通过使得背景向量线性投影后的低维特征与行为之间希尔伯特-施密特范数最大化,从而实现背景向量与行为之间的依赖关系最大化,更好地发现两者之间的关联性,减小属性值残缺带来的影响。然后利用分类模型支持向量机(Support Vector Machine,SVM)对低维特征进行学习(CCS+SVM),实现高效预测。在恐怖组织行为族群(Minorities at Risk Organizational Behavior,MAROB)数据集上的实验表明:基于CCS+SVM的性能优于SVM模型、基于传统特征提取方法主成分分析(Principal Component Analysis,PCA)和典型相关性分析(Canonical CorrelationAnalysis,CCA)的SVM模型,以及已有的恐怖行为预测算法CONVEX。  (2)提出了一种基于权重因子的改进的SVM算法。该改进的算法通过给予软边界SVM算法中少类和多类样本对应的松弛变量不同的权重,提高少类样本的权重,从而增大少类样本对模型的影响,进而提高对少类样本的预测能力。在恐怖数据集MAROB中ARMATTACK和BOMB两种恐怖行为的实验表明,改进的SVM算法对少类样本的预测效果要优于几种典型的机器学习算法,尤其在查全率方面都有明显优势。  (3)采用模块化的设计原理及面向对象思想,利用Java语言在MyEclipse2014开发平台下,设计并实现了基于特征提取和类不平衡问题预测恐怖行为的原型系统。
其他文献
随着信息技术的不断发展,特别是Internet应用的普及,电子文本信息急剧增加。如何有效地组织和管理这些海量信息,并且能够快速、准确地获得用户所需要的信息是当今信息技术领域的
如何能在复杂多变的无线信道环境下对数据进行高速可靠的传输,成为通信业界学者研究的热点。多输入多输出(Multiple-Input Multiple-Output,MIMO)技术与正交频分复用(Orthogonal F
BPEL作为描述Web服务编制的语言之一,在商业流程中被用来描述活动和对活动的控制。BPEL具有类似程序设计语言的语法结构,如顺序、分支和循环等,能表达对业务流程的控制。BPEL
现场总线是一种用于智能化现场设备和自动化系统的开放式、全数字化、双向串行、多站或多节点的通信系统。基于现场总线的控制系统正在逐步取代传统DCS(DistributedControl S
面对如今信息技术的飞快发展,各种电子文档和电子邮件都爆炸式的增长,为了从海量文本中及时准确的获得有效的知识和信息,就需要处理大量的文本。由于互联网上大部分信息都是以文
学位
生物特征识别技术是指通过人体所特有的生理特征或行为特征来进行个人身份验证的一项技术。相对于其它的生物识别技术,指纹识别技术在广泛性、持久性、独特性、存储安全性和易
随着互联网络技术的不断发展,人们对网络应用的需求不断向多样化、智能化和个性化的方向发展,现有网络体系结构中多种网络和多种技术共存的弊端日益明显,多种网络的互通与融
统一建模语言(Unified Modeling Language,UML)已经被面向对象建模领域公认为事实上的工业标准。使用UML描述的软件模型,表达简洁、直观,便于建模人员进行交流沟通。然而,这
移动自组织网络具有良好的移动性和灵活的组网能力、不需要任何预先建立的基础设施,因而成为了目前网络研究的热点之一。移动自组织网络最初被设计应用于战时通信指挥和灾害救