论文部分内容阅读
我国现阶段侵财类案件发案率高、破案率低,严重威胁着公民的财产安全。针对侵财类案件进行客观、及时的风险分析十分必要。风险通常以事件后果和发生可能性的组合来表达。针对侵财类案件后果和发生可能性的传统定性分析方法成本高且难以验证,传统定量和半定量分析方法精确度低且灵活性不足。本文以案件危害程度作为后果,以发生概率作为发生可能性,针对抢劫、抢夺和盗窃三类典型侵财类案件提出了基于机器学习的典型侵财类案件危害程度及发生概率预测分析方法。针对典型侵财类案件的危害程度,本文利用ZS市2008—2014年的犯罪数据与统计年鉴数据,提取“发案时间”“发案地域”“选择时机”“选择处所”“选择对象”“人均地区生产总值”“职工月平均工资”7个特征,建立基于多种机器学习分类算法的侵财类案件危害程度预测模型,并进一步开展预测结果的分析研究。研究结果表明:梯度提升决策树(GBDT)算法性能表现最优,盗窃类案件危害程度的预测准确率达到了0.88;在抢劫案和抢夺案中,一般和重大的案件容易发生在繁华地带,特大案件容易发生在除住宅地、偏僻地区、公路地区和繁华地带的零散区域;侵财类案件倾向于在工作日的城区中发生,发生的危害程度大多为一般(危害程度分为一般、重大和特大三个级别)。针对典型侵财类案件的发生概率,本文利用ZS市2005年2月1日至2015年7月31日的实际侵财类案件以及实际天气数据,选取案件统计信息和天气信息作为特征,预测典型侵财类案件的发生概率。基于时间滞后的典型侵财类案件发生概率预测分析结果表明:K最近邻模型表现最优,预测盗窃类案件发生概率的R~2值达到了0.83,预测抢劫类案件发生概率的R~2值达到了0.88,预测抢夺类案件发生概率的R~2值达到了0.8。基于实时数据的典型侵财类案件发生概率预测分析结果表明:抢夺案的K最近邻回归模型性能表现最好,R~2值达到0.7。本文构建的模型能够较好的预测分析典型侵财类案件的危害程度及发生概率,可以应用于典型侵财类案件的预防、打击工作中,为治安防控提供决策支持。