论文部分内容阅读
犯罪不仅威胁到广大人民的生命财产安全,也给社会稳定带来隐患。学者已经在犯罪领域开展了大量的研究,以期为公安部门的工作提供决策支持和实际指导。犯罪地理学是犯罪研究的一个分支,它将犯罪学知识与地理学相关理论结合,通过犯罪活动时空分析识别犯罪分布规律和模式,甚至对犯罪变化趋势等进行预测。随着“大数据时代”的到来,犯罪地理学研究不再仅仅满足于数据呈现在图表上的表面知识,而是越来越注重探索数据背后所蕴含的真正价值,这将为警务工作带来变革。 本文以上海市长宁区为研究区域,尝试使用时空分布分析、关联规则挖掘和支持向量机方法分析城市盗三车类案件。首先,分别选取不同的时间尺度(包括季节、月份和一天24小时)和空间对象(包括居委和道路)进行标准差椭圆、核密度和空间聚集分析。其次,建立案件的时段路段事务表,采用关联规则方法进行知识发现。最后,利用支持向量机方法对未来一段时间内各居委的发案情况进行预测。 研究发现:(1)时间分布方面,盗三车类案件在季节尺度上按照冬春夏秋的季节顺序循环增减;在月份尺度上的发案量规律性比季节尺度更加明显精确,并体现出案发量在季节内也是存在波动的;在24小时内的案发量具有明显的周期性,一天之中存在两个波峰和波谷,这与人类的活动规律具有密切关联。(2)在空间分布上,长宁区大部分盗三车类案件集中在东北部,且不同季节盗三车案件的空间集聚特征不同;南北方向道路单位长度的发案数量比东西方向的道路发案频繁,这可能与作案后有益于跨区逃窜因素有关。(3)通过将时空关联规则提取结果可视化展示,发现长宁区的西北部是白天时段盗三车案件的高发地区。中部地区的春、秋、冬季主要为晚上发生盗三车案件,有少数道路是白天时段发案并且主要集中在夏季。东部地区是春、秋季节的高发案区,这两个季节东部地区凌晨也成为了高发案时段。且夏季主要是夜晚时段发案,冬季主要是白天时段发案。(4)支持向量机方法是一种建立在统计学理论基础上的数据挖掘方法,其核心是核函数。在非线性可分问题方面通过核函数将数据集映射到高维空间,以结构风险最小化为原则进行分类。研究选取的因素包括居委人口总数、居委外来人口总数、居委距最近派出所的距离、前一个月该居委发案数量、前一个月该居委是否发案、居委的警力巡逻密度。通过选取不同因素组成训练数据集、选取不同核函数进行建模。通过构建混淆矩阵,使用精度和召回率评价生成模型,并在实际应用场景中进行检验。比较发现属于全局性核函数的高斯核函数泛化性能较强、学习能力较弱而属于局部性核函数的多项式核函数具有学习能力强、泛化性能较弱的特点。并且相对来说,选取居委人口总数、居委外来人口总数、居委距最近派出所的距离、前一个月该居委发案数量这四个因素构成的数据集在预测方面有相对较好的效果。