论文部分内容阅读
时空数据挖掘是深度学习领域的前沿课题之一,犯罪时空预测是其重要分支。现阶段的犯罪时空预测面临的主要问题有:时空相关性捕捉不足,缺乏对长期依赖的捕捉且空间研究单点化;细粒度研究不足,由于细粒度下数据高度稀疏,建模困难,小时级的时空细粒度犯罪预测准确率较低。为解决以上问题,本文主要对盗窃等传统犯罪开展研究,分别针对时空粗粒度和细粒度构建了深度时空网络,预测未来的犯罪情况,以期为公安机关的精准指挥提供参考。针对时间粒度为月、空间粒度为社区及以上的粗粒度犯罪数据,构建了基于改进LSTNet的犯罪预测模型。首先,该模型在LSTNet的基础上增加了STL模块,利用STL分解出时间的趋势分量T、季节分量S、残差R。然后,将LSTNet中LSTM、Skip-RNN、AR三个网络的架构调整为并行结构,使T、S、R三个分量分别输入三个网络中,三个并行网络的输出结果融合后输入到卷积层。最后,引入了空间注意力与类别注意力机制,捕捉其它地理单元与目标犯罪的相关性,以及本地理单元其它类别犯罪与目标犯罪的相关性。该模型解决了时空相关性捕捉不足的问题。在芝加哥公开犯罪数据的实验中平均RMSE为2.968,优于其它对比模型。针对时间粒度为小时,空间粒度为网格的细粒度犯罪数据,构建了基于改进STResNet的犯罪预测模型。首先,将每一时刻的犯罪数据转化为图像的像素分布。然后,设计了可调节深度的时间特征提取模块,通过图层叠加的方法提取犯罪数据的时间特征,并将时间特征输入四个并行的残差网络,通过加深网络层数有效捕捉近距离、中距离、远距离的空间相关关系。最后,将四个残差网络的输出进行融合,并加入天气、节假日等相关因素,共同参与模型训练。该模型解决了由于细粒度犯罪数据的高度稀疏性使模型表现降低的问题。在芝加哥盗窃犯罪数据上的实验表明,该模型可以实现以10%的定义热点区域平均命中58.51%的盗窃犯罪,以20%的定义热点区域平均命中78.34%的盗窃犯罪。平均命中率和PAI均优于其它对比模型。最后,将该模型在国内T市进行了应用与验证,取得了良好的效果,证明了模型的可行性。