Hadoop下基于分类和关联规则的公安数据挖掘研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:ftlfh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着警务信息化建设的力度逐年增大,公安内部累积了海量的业务数据,越来越多的公安科技部门发现,传统的数据库技术已经出现疲软,相关情报研判和案件侦破的速度与智慧城市之间的矛盾日益突出,智慧公安成为缓解这一矛盾的关键。公安大数据挖掘技术是实现智慧公安的基础,高效、准确的大数据分析技术对公安部门的警情分析、预警、犯罪预测等具有重要意义。近几年,由于Hadoop强大的存储技术和计算能力,使其在全球范围内得到了飞速发展,这也为公安大数据挖掘提供了新的契机。  论文在大量查阅国内外文献,深入研究公安数据特性及数据挖掘算法的基础上,根据公安科技部门的实际需求,对公安大数据挖掘中的文本分类和关联规则进行了重点研究,提出了差分多层KNN分类算法和基于规则加权的多数据集时态关联规则算法,并通过实验验证了算法的有效性。为此,论文的研究内容主要集中在以下几点:  (1)提出了一种基于分层和差分的改进算法——DMKNN算法。针对KNN算法在处理公安数据时无效计算量大的问题,改进后的算法对训练数据集构建树状分层结构,仅对高层筛选后的训练集进行相似度计算,同时针对大数据量下的类域交叉性特点,采用了差分和动态增加类别的方法来有效的防止最近邻和次近邻的误判情况,实验结果表明该算法与传统KNN算法相比在对样本容量大,涉及邻域多的公安数据进行分类时能取得较好的分类效果。  (2)实现了Hadoop平台下的DMKNN文本分类算法。结合文本分类并行化方案,实现了DMKNN分类算法的MapReduce并行化,最后进行了基于DMKNN算法的公安情报并行化分类实验,实验证明并行化后的改进算法具有很好的加速比性能。  (3)提出了基于规则加权的多数据集时态关联规则算法。首先将各个子数据集中的时态关联规则的时态因素分别进行区间归并和延展,并利用有效投票率对规则进行剪辑,然后对剪辑后的各个同类子数据库中的规则进行加权合成来得到最终提交的全局时态关联规则,随后以实例分析的方式实现了算法的挖掘过程。最后的犯罪预测实验证明该算法不仅可以用于不同数据库间的关联挖掘,而且很大程度上缩减了挖掘出的无意义的关联规则,具有一定的现实意义。  
其他文献
随着生产水平的不断提高,机械设备的故障诊断技术逐渐成为热门的研究领域,而轴承作为机械设备的核心器件,对其进行故障诊断更是意义重大。准确的对轴承进行故障诊断已经成为摆在我们面前的一项重要课题。本文在分析了国内外轴承常见故障机理的基础上,明确了内环以及外环故障是轴承故障的主要原因,依此设计了针对轴承内环、外环故障,采用加速度传感器进行数据采集与故障诊断技术研究的技术方案。本文首先对基于振动信号的轴承故
随着交通运输业和汽车制造业的持续快速发展,人们对出行的要求越来越高,汽车逐渐成为人们日常出行重要的代步工具之一。它给日常生活带来舒适、便捷的同时,随之产生的交通事故直
颅脑亚低温治疗具有显著的神经保护疗效,虽然全身亚低温治疗得到了较多的临床应用,但是存在着冷却速度慢、会引发拮抗器官并发症等缺陷。选择性亚低温治疗可以克服这些不足,
多电机同步协调控制被广泛应用于工业生产中,如何提高系统的同步控制性能成为研究的热点问题。本课题研究对象是一个多变量、时变、强耦合的三电机同步控制系统,针对系统中电机
学位
随着互联网技术的迅猛发展和各种存储设备性能的大幅提升,各种图像数据数量飞速增加,如何对海量的图像数据进行有效管理成为了一个亟需解决的问题。为每幅图像分配相应的类别标
国内道路除标、机场除胶等清洗行业前景广阔,但高效的成套清洗设备极度缺乏,几乎被国外几家企业所垄断。南京大地水刀股份有限公司,是国内第一家研制生产超高压水切割数控设备的
化石能源的大量使用导致了大量CO2的排放,而CO2是造成温室效应的主要气体之一。世界各国意识到温室效应的严重性,在京都议定书中已就CO2减排问题对很多国家进行减排分工。  
在互联网飞速发展的今天,软件已经成为了人们日常生活中不可或缺的工具。一些特殊软件的漏洞引起的损失是巨大的,同时随着软件的规模扩大,更多的潜在错误会难以发现。为了保证软
近红外光谱检测技术越来越成熟,便携式光谱检测仪越来越丰富,但是依然存在价格昂贵、操作复杂等问题,小型化、智能化、低成本成为便携式检测仪的发展趋势。因此提出一种新的苹果糖度检测方法,实现检测仪的小型化、低成本、智能化,显得尤为重要。本文提出了基于多特征波长的苹果糖度检测方法,设计了基于该方法的检测装置的总体方案,阐述了检测装置的光路结构设计、电路设计和软件程序开发。廉价的LED光源,独特的光路结构设