论文部分内容阅读
本文以解决实际生活中会遇到的问题即如何从现在这个信息化的时代中的海量人员信息,筛选分析并查找出所需要的人员信息为出发点撰写本篇论文,着力于为这个问题提供自己的建议,为解决这个问题贡献自己的一份力量。本篇论文的主要内容是,基于Neo4j数据库进行人员关联分析并设计一个吸毒倾向预测平台,可以分为以下几个方面。第一方面是本文研究的社会背景以及研究目的和国内外对于这一领域的研究现状,第二方面是相关的理论知识介绍,其中包括了与图形数据库Neo4j、svm分类器等相关概念的简介,第三方面是平台的设计,包括了核心原理的设计、对数据的分析筛选和预测、并结合实际吸毒人员分析系统等,最终实现对嫌疑人是否有吸毒倾向进行准确预测。许多数据模型在数据库技术的发展中应运而生。常用的模型有三种,即层次模型、图形模型和关系模型,关系模型基于严格的数学、高度的数据独立性和安全性。关系型数据库是目前应用最普遍的数据技术,但是随着数据规模的扩大和数据复杂度的提高,关系模型已经不能满足实际应用的需要。以社会化重新设计为例,关系数据库自身的不足会导致数据的冗余,社交网络数据的动态性也给关系型数据库带来了更大的挑战,在应对不同层次的复杂检查上也有缺陷。而在动态的数据之间,我们又把注意力转向了图形数据库。图形数据库能够有效地存储、管理和更新数据及其内部关系,能够执行复杂的多层操作,而Neo4j便是其中的代表。基于图数据库的吸毒人员社交关系分析系统中,通过分析吸毒人员社交关系背景、吸毒人员社交关系数据来源与关系定义,最后对吸毒人员社交关系所得数据进行分析处理得出预测算法的实现方向。在预测平台设计时分析了犯罪嫌疑人吸毒倾向预测的原理和数据来源,详细描述了如何对犯罪嫌疑人吸毒趋势进行预测,然后描述了犯罪嫌疑人吸毒倾向预测数据的来源和预处理。为下一个模型的训练和测试奠定了基础。最后,将其分为两类核函数模型,详细描述了预测犯罪嫌疑人吸毒倾向的过程和结果,最后总结并选择相应地的核函数类型,选择合适的参数值,选择合适的阈值,在这样的情况下达到最好的精确率和召回率从而使预测结果更加准确。但是由于正负样本数量的不平衡,精确率不够高,或者有更好的特征没有使用,这些都是未来可以改进的方向。由于本人的学术能力和知识范围有限,所以撰写的论文难免有不足之处,欢迎各界人士的批评指正。