【摘 要】
:
大数据时代的到来,对案件的侦查、审理和定性提出了更大的挑战,利用现有的机器学习方法,对新发生的刑事案件结果进行准确合理的预测,减少误判案件的发生显得越来越重要。文章以刑事案件中如何确定侵犯公民人身权利的两种犯罪类型(故意杀人罪和过失致人死亡罪)为例,选取美国数据样本作为实验数据,建立了犯罪类型是谋杀(Murder)还是误杀(Manslaughter)的预测模型及决策系统,能够为我国刑事案件辅助决策
论文部分内容阅读
大数据时代的到来,对案件的侦查、审理和定性提出了更大的挑战,利用现有的机器学习方法,对新发生的刑事案件结果进行准确合理的预测,减少误判案件的发生显得越来越重要。文章以刑事案件中如何确定侵犯公民人身权利的两种犯罪类型(故意杀人罪和过失致人死亡罪)为例,选取美国数据样本作为实验数据,建立了犯罪类型是谋杀(Murder)还是误杀(Manslaughter)的预测模型及决策系统,能够为我国刑事案件辅助决策领域提供可借鉴的理论基础和系统实现。本文所作的主要工作有以下三点:(1)完成了638454条样本数据的预处理,得到14467条训练集数据和4823条测试集数据。结合犯罪记录数据的实际情况,分析决策模型对数据的客观要求,采取了相应的策略对数据进行处理。首先剔除不合时宜的数据实现数据的清洗;再根据实际情况采取众数或均值填充或分组填充缺失值;采用标签编码实现特征转换;对数据进行重采样;采用Featexp模块实现数据的降维以及最终的数据拆分工作。(2)完成了决策模型的设计与创建,预测准确率达到96.10%。文章分别采用CART算法,RandomForest算法,AdaBoost算法创建决策模型,实现了刑事案件辅助决策的目标,各模型的准确率分别达到了89.07%、90.77%、96.06%;得出了各个特征对目标的影响状况,便于以后对特征有偏向性的分析与应用;最后,基于优劣解距离法改进Stacking策略并集成以上三种算法,再一次将预测的准确率提升至96.10%。(3)完成了刑事案件辅助决策系统的设计与实现。基于RandomForest决策算法,采用B/S系统架构,利用Java+SpringBoot+BootStrap+MySQL+IDEA技术,实现了具有犯罪记录管理、犯罪类型决策和权限日志管理功能的辅助决策系统。最后,根据实验结果以及决策系统的测试使用,可为我国刑事案件辅助决策相关领域的研究提供参考建议,并对此次研究过程中存在的不足进行了总结,需要在今后的刑事案件辅助决策研究中作进一步的改进。
其他文献
甲烷是大气污染气体之一,也是易燃易爆气体。实时监测甲烷气体浓度对于环境保护、安全生产具有重大意义。敏感材料涂覆光纤表面等离子共振(SPR)传感器具有抗电磁干扰、电绝缘、耐腐蚀、可多点复用等诸多优点,广泛应用于工业气体在线监测和空气质量监测等领域。本文围绕甲烷气敏材料涂覆光纤SPR传感器,开展了以下几方面的工作:首先,阐述了光纤SPR甲烷气体传感器的研究目的与意义。对甲烷气体传感器的国内外研究现状进
湿度测量在农业、医疗卫生、生物工程、化学工程、环境监测、食品药品加工、文物保护及森林防火等领域具有重要的地位。传统的电类湿度传感器灵敏度高并具有广泛的应用市场,但其响应速度较慢、无法在极端环境下测量。光纤湿度传感器抗电磁干扰、响应速度快、体积小、质量轻、耐腐蚀,具有重要的研究意义和应用前景。模间干涉型光纤干涉仪与传统光纤干涉仪相比,不仅降低了系统的复杂程度,而且提高了系统的稳定性,在湿度传感领域中
在光纤传感领域中,温度一直都是与人类的生产和生活密切相关的物理参量。本文在光纤温度传感技术的研究基础上,分别提出并制作了基于聚合物填充石英毛细管的三种不同的高灵敏度温度传感器。所研制的F-P腔型光纤微结构传感器不仅灵敏度高,而且制备方法极其简单,极易重复,成本极低,这些优势都将使得这些传感器在温度传感领域有更大的应用前景。本文的研究工作主要如下:(1)分析了各种液态温敏材料的物理特性,总结了液态温
流量测量是现代测试计量技术的重要组成部分,流量传感器广泛应用于工业生产和生活的各个领域。传统的流量传感器普遍有体积大,结构复杂,准确度差和易受电磁干扰等缺点,利用光纤光栅和传统流量传感器结合,使用光信号替代电信号制作而成的新型光纤光栅流量传感器,则可以很大程度上克服传统流量传感器的缺点,因此基于光纤光栅的流量传感器已经受到科研人员越来越多的重视。本文在传统流量传感器的基础上,结合光纤光栅传感技术,
文本数据作为最常见的数据形式之一,涵盖范围广、数据量大,又有密度不均的特点,不同平台中存储的文本数据结构不定相同,结构化文本数据、半结构化文本数据和非结构化文本数据并存。文本挖掘工作便是从这些海量、密度不均、异构的文本数据中提取隐含的、有价值信息以供决策或预测等使用。特征提取作为文本挖掘工作中不可缺少的关键步骤,其提取出的特征项的优劣会直接影响文本挖掘后续工作,将深度学习人工神经网络模型用于特征提
随着大数据时代的到来,具有多层次结构的数据越来越普遍,利用层次结构来对决策信息表(简称决策表)进行属性值泛化约简可以在保证分类能力不变的前提下有效降低决策表的维度,而构造合理的层次结构是研究属性值泛化约简的前提,因此研究层次结构构造方法和决策表的属性值泛化约简方法在高维数据越来越普遍的大数据时代具有重要意义。目前关于决策表的属性值泛化约简以及层次结构构造的研究大都是基于决策表的条件属性集,针对决策
车标识别能够获取车辆的品牌信息,而目标检测是用来解决图像定位与分类的综合性问题,因此,本文将目标检测与车标识别相结合,以便于能够快速识别车标的信息。然而传统的目标检测算法需要手动提取特征,训练过程繁琐,检测速度较慢,且大多是特征提取效果不够好的浅层神经网络。YOLOv4是一种单阶段的快速目标检测算法,具有较高的检测精度与速度,因此,本文通过阐述车标识别的研究现状,分析卷积神经网络与目标检测技术的相
油库是储存油料的基地,油库系统的稳定性和高效性直接影响着整个产业的工艺生产和经济效益。因此,设计一个安全高效的油库监控系统,对于提高油库生产效率和提升系统自动化监管水平是极其重要的。本课题以西安市某油库为研究对象,按照厂家要求和油库工艺特点确定了控制需求,设计了基于西门子S7-300 PLC和PROFINET与PROFIBUS-DP总线相结合的计算机监控系统设计方案。在确定总体方案的基础上,进行了
随着对石油需求量的与日俱增,进一步提高原油的开采效率,已成为当前油田开发和建设的重要工作。河南油田大多属于疏松砂岩油藏,长期受到高含沙、低渗透等地质条件的制约,在采油生产过程中由于地层供液能力和泵抽汲能力的不匹配会造成油井动液面的变化,直接影响到射流泵采油的效率和能耗,研究基于动液面的同心射流泵智能采油控制系统具有重要的意义。课题通过对河南油田射流泵采油排砂工艺及其设备和油井动液面变化对射流泵采油过程影响的分析与研究,确定了射流泵智能采油控制系统的需求,并结合射流泵采油控
多准则分类是指通过一簇有序的条件属性(或称为条件准则),将具有优先顺序的决策类进行分类。在现有研究中,基于优势关系的优势粗糙集方法已经成功地被引入到多准则分类问题中,用来表达和解释与优势原则不一致的问题。在实际应用中,属性值往往具有层次结构,可以让人们从不同的角度组织、查看和分析数据,以适应偏好的变化。然而,在已有研究之中,分层多准则决策系统中的属性约简还未涉及,已有关于近似集更新的增量学习研究也