关联规则算法研究及其在美洲进出口贸易数据挖掘中的应用

来源 :上海大学 | 被引量 : 0次 | 上传用户:snowmanuser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机性能提高、成本下降以及数据管理技术的成功运用,社会信息化程度越来越高,数据存储量急剧上升。然而,“数据丰富,知识匮乏”,决策者很难从海量的数据中提取出有价值的知识。面对这一挑战,数据挖掘应运而生。数据挖掘有许多研究方向,关联规则挖掘是其中最活跃的研究方向之一,它反映了大量数据中项目之间的有意义关联或相关联系,其中最经典的算法是Apriori算法。但是该算法在挖掘频繁项集时需要产生大量的候选项集,多次扫描数据库,时间空间复杂度过高。针对这一局限性,如何提高挖掘算法的效率就成为了关联规则挖掘研究的核心问题。随着各国进出口交易往来的频繁,进出口贸易数据对研究和分析贸易市场行情和趋势所起的作用正日益显现出来,而采用数据挖掘中的关联规则技术可以从海量的进出口贸易数据中得到有价值的关系和规律,从而为决策提供参考。本文对关联规则挖掘算法进行了深入地研究,提出了一种改进方法,并将此方法应用于美洲进出口贸易数据挖掘中,得到可供决策参考的关联规则。本论文具体工作如下: 1.理论介绍。对数据挖掘和关联规则的基本理论进行了详尽的阐述,通过理论介绍为算法研究和系统应用奠定了基础。 2.算法研究。在理论认识的基础上,深入分析了关联规则挖掘经典算法Apriori。针对大型关系数据库中关联规则挖掘的特点,提出了一种基于分块编码的新算法LCA,对其从理论、流程各方面进行了详细介绍并演示了其实现步骤。最后通过实验比较了LCA算法和Apriori算法,验证了改进算法的有效性和优势。 3.系统应用。基于J2EE平台,设计开发了一个简易的专业数据挖掘系统,系统可以选择性地采用经典的Apriori算法和新提出的LCA算法进行关联规则的挖掘。系统应用部分既是对算法研究和改进的一种实际验证,又是对数据挖掘应用领域的一种开拓,实现了理论研究与实际应用的结合。
其他文献
随着生物工程技术的迅速发展,发酵工业越来越受到科技界、生物界的重视,对发酵工业过程的自动控制的要求也越来越迫切[1]。基于实验数据进行建模、参数估计以及对过程的仿真
本文在对中国股票市场的收益率与交易量进行大量实证研究的基础上,构造了中国股票市场区别于成熟资本市场的特殊信息传导模型,并用此模型对中国股票市场上的一些特殊现象做出了解释。本文主要结论是:1、中国股票市场的交易量主要是由信息传导造成的;2、中国股票市场的信息传导有一定偏差,尤其是小盘股存在明显的过度反应现象;3、中国股票市场的不同股票有不同的信息传导机制,这直接影响中国股票的收益性、流动性等特点。
随着社会生产的发展,城市大气污染日益严重,对大气污染物浓度的预报也越来越受到重视。大气污染物浓度预报中,统计预报方法特别是神经网络方法是一个研究热点。  本文以黑龙江
井筒内壁变形监测是井筒变形灾害防治的重要前提。针对目前井筒变形监测精度差、效率低的缺陷,研发了一款井筒内壁快速成图系统。系统包含硬件和软件两个部分。其中硬件系统
当今时代是信息爆炸的时代,为了在庞大的信息资源中找到真正需要的信息,搜索引擎应运而生。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处
随着高新技术的快速发展和应用,工业生产过程对自动控制系统的要求越来越高,不仅要求控制有很高的精确性和很好的快速性,而且要求系统有很强的抗干扰能力。在常规反馈控制系统中
随着我国经济的飞速发展,对钢材的需求也在不断的增长,为钢铁行业的发展提供了一个良好的发展机遇,轧钢工业逐步由集散控制系统发展到了现阶段的网络控制,计算机技术、现场总
工业企业是能源消耗的主体,全面、准确地了解企业具体的能源消耗情况及其产生的效益,将有利于企业节能潜力的分析、企业能耗的有效控制和决策。因此,切实可行的企业能效评估手段
近年来,中国人口红利逐渐消失,劳动力短缺和成本上升问题使得传统制造业转型升级势在必行,而“机器换人”成为企业提高生产效率、降低生产成本的必然选择。企业对于各种工业
对化工过程进行监控与故障诊断确保生产过程的稳定性和安全性是现代化化工生产中一个热点研究问题。本文针对化工过程的故障诊断问题,提出将径向基网络的重要变形—概率神经