论文部分内容阅读
进入信息时代,对数据的分析与挖掘已成为一种新的增长驱动力量。海关掌握着国家合法进出口货物的全部数据,数据规模巨大且质量良好。如何通过分析这些数据获得其中隐含的信息,辅助提升海关监管效能,成为我国现代海关建设所面临的一个重要课题。传统的风险分析手段已不能满足时代对海关的要求。本文以海关税收风险为研究对象,尝试使用贝叶斯网络方法构建税收风险识别模型,是使用数据挖掘方法分析预测海关税收风险的一种尝试。
本文首先对国内外海关运用数据挖掘技术进行风险分析的研究情况进行了综述,然后分析了我国风险管理制度的发展沿革与风险分析方法的应用状况。本文使用专家调查法与统计学检验相结合的方法选定构建贝叶斯网络模型所使用的影响因素,然后利用SPSS Modeler18.0软件通过对数据进行机器学习,构建树扩展的朴素贝叶斯网络结构的风险识别模型。
本文通过对已建立模型的多种测试比较,发现该模型具有时效性与区域性的特点,在恰当选择训练集范围的前提下,该模型有较好的风险识别效果。最后,本文针对海关数据分析技术应用水平的提高提出了一些建议。
本文首先对国内外海关运用数据挖掘技术进行风险分析的研究情况进行了综述,然后分析了我国风险管理制度的发展沿革与风险分析方法的应用状况。本文使用专家调查法与统计学检验相结合的方法选定构建贝叶斯网络模型所使用的影响因素,然后利用SPSS Modeler18.0软件通过对数据进行机器学习,构建树扩展的朴素贝叶斯网络结构的风险识别模型。
本文通过对已建立模型的多种测试比较,发现该模型具有时效性与区域性的特点,在恰当选择训练集范围的前提下,该模型有较好的风险识别效果。最后,本文针对海关数据分析技术应用水平的提高提出了一些建议。