基于数据挖掘技术的海关执法评估系统的研究与开发

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:yu0426
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机网络与数据库技术的迅速发展和广泛应用,使得“丰富的数据与贫乏的知识”问题亟待解决。因此,我们必须寻求新技术和自动工具,以便帮助我们从大量数据中找到潜在有用的信息和知识。数据挖掘技术和KDD(数据库中的知识发现)系统作为一种崭新的技术和工具,能自动地分析数据、自动地对数据分类、自动地对数据汇总、自动地发现和描述数据中的趋势、自动地标记异常。 数据挖掘是数据库系统和新的数据库应用的一个有希望的、欣欣向荣的学科前沿。知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘是知识发现过程的一个基本步骤。KDD是一门交叉学科,它涉及统计学、数据库技术、计算机科学、模式识别、人工智能、机器学习等多个学科。 数据挖掘已广泛应用于生物医学、金融、零售业、电信业等领域,并产生了巨大的效益。本文探讨了数据挖掘在政府部门的应用,并给出一个具体的实例。在对SAS提供的各种数据挖掘工具和方法比较之后,选择了适合本课题需要的方法应用于海关总署直属海关执法评估系统的开发项目中,并取得了满意的结果。 论文共有八章: 第1章:简略介绍了知识发现和数据挖掘的概念与发展现状、知识发现的过程与数据挖掘的分类、本课题的研究背景和意义以及论文的主要研究内容。 第2章:介绍数据挖掘之前的数据预处理技术。讨论数据清理、数据集成和变换、数据归约的方法。 第3章:介绍基于回归模型的预测方法。包括多元线性回归、曲线回归以及逐步回归模型。 第4章:介绍聚类分析方法。首先介绍聚类和分类的概念,然后讨论了十一种数据聚类方法。 一 第 5章:介绍决策树方法。详细阐述了决策树的构造算法,并提出在数 据挖掘中应用决策树方法时需要考虑的问题和解决的方法。 第 6章:介绍神经网络方法。主要讨论人工神经元与感知器以及人工神 经网络模型,包括BP神经网络和RBF神经网络。 第7章:介绍海关执法评估系统的开发环境和有关方法、功能需求与设 计分析以及开发与实现。 第8章:提出了数据挖掘算法下一步的发展方向。
其他文献
伴随着Internet商务应用和企业间电子交互需求的出现,业界诞生了"数据库/Web服务器/浏览器"的计算模型,该模型为企业提供了新的发展机遇,但是在这个模型中也存在许多如:安全
通过对VOD技术、服务器负载均衡理论和服务器集群理论的研究与分析,该文提出了媒体服务器集群的设计方案,详细阐述了OpenVideo系统的媒体服务器集群和负载均衡的设计与实现,
论文主要研究内容包括:1.研究了主分量分析方法,结合面瘫判定的应用特点,对于单帧静态表情图像,用主分量分析的方法判别表情模式.提出沿对称轴相减的预处理方法,判定模式时引
该文简要介绍了访问控制技术的研究状况,详细描述基于角色的访问控制技术的相关内容;分析了时间特性在访问控制技术中的重要意义;提出一个基于个体的时间访问控制模型(TIBAC)
大数据时代,关系型数据库不再适合存储海量的大数据,如何存储和处理海量数据已成为一个难题。Hadoop的出现使问题出现了转机,它是一个对大量数据进行分布式处理的软件框架,其核心
随着计算机技术的发展和应用,当前Intel芯片和Windows操作系统成为一个主流发展方向,在市场上占有相当大的比率。这种趋势使得很多厂商都必须去发展自己的产品,使其能与Windows
该课题是IBM的大学共享研究项目(SUR)中的一个组成部分,其目的是实现下一代语义万维网的基础构架.该文的贡献和创新之处总结如下:●将语义万维网和知识表示相结合,从知识表示
水电仿真系统的目的是建立一个对水电厂运行进行仿真的环境,用来培训运行人员,达到完成培训后即可上岗工作的要求.相比在真实仪器上的培训,它具有代价小、速度快的优势.其中
随着计算机网络的飞速发展,人们的生活方式也发生了巨大变化。人类逐步进入了信息时代。互联网的广泛应用在给人们的工作和生活带来了极大方便的同时,也带来了不能忽视的负面影
到目前为止,万维网已经成为世界上最丰富和最密集的信息来源,但是,它的结构使它很难用系统的方法来利用信息.为了高效率地利用这些数据,首先必须要研究异构数据的集成问题.以