论文部分内容阅读
“金盾工程”建设在全国进入全面推进的新阶段,城市公安信息化基础工作建设取得了巨大成绩,同时也存在一些问题,如公安各类信息资源没有得到充分挖掘和合理利用,不能以简便、灵活的应用手段为领导和一线民警开展工作提供综合信息和科学决策支持。近年来发展的数据挖掘技术能够发现数据中隐藏的规律,起到辅助决策的作用。本文研究的主要内容是数据挖掘技术在城市公安应用研究中一个重要部分——刑事案件的关联分析模型。本文首先提出了城市公安刑事案件关联分析模型的总体框架,然后研究了模型各步骤中使用的方法与算法,主要有以下几个方面:在数据预处理过程中,给出了适合公安数据提取与清理的策略,在此基础上,建立刑事案件多维数据模型,包括选取星型数据模式,使用分箱等方法对数据进行离散化与概念分层处理,建立数据立方体。然后进行多维关联规则挖掘,利用改进的Apriori算法寻找频繁谓词集,按照最小支持度与最小置信度的要求在频繁谓词集中产生强关联规则。在进行多层关联规则挖掘时,本文分析选取了层交叉单项过滤策略,通过修改多维频繁谓词集算法来发现不同概念层中的频繁谓词集,产生强关联规则,最后利用检验冗余规则原则去除冗余结果。在本文的最后,利用大连市公安局提供的刑事案件数据,按照模型的方法与步骤,选择了适当的工具,完成了大连市甘井子区刑事案件的关联分析,验证了模型的正确性与有效性。本文的研究为今后城市公安数据挖掘应用研究提供了参考,对辅助公安决策具有理论意义与现实意义。