论文部分内容阅读
随着计算机应用范围的日益扩大,数据库技术和挖掘技术的的不断发展,数据挖掘和知识发现(DMKD)技术应运而生,并得以蓬勃发展,越来越显示出其强大的生命力。关联规则挖掘作为数据挖掘中最活跃的研究方法之一当前已被广泛应用在西方金融行业大型物流企业以及一些电子商务网站中去中,它可以成功预测诸如银行客户需求,股票、期货市场的变化等,给顾客带来方便的同时也给企业带来了巨大的效益。股票流通市场上的价格是反映经济动向的晴雨表,股票市场对国民经济的发展具有重要作用,因此对股票市场的研究具有重要意义。在基础分析和技术分析的前提下,运用计算机技术来对股票市场进行技术分析成为一个主要的辅助手段,在实际操作中具有重要的意义。本文的主要研究方向就是运用数据挖掘的知识来对股票交易数据进行有效的分析处理,以发现这些数据间的内在相互联系。本文首先对数据挖掘相关知识做了详细的研究,其次介绍了股票分析和预测的背景知识和方法。然后着重从以下三个方面进行讨论:首先是对关联规则算法的分析,着重研究分析了apriori算法和DHP算法,对给定支持度下频繁项集的产生、迭代与修剪进行了细致的描述。并对两种算法的效率与各自优缺点进行了分析。在两种算法的基础上提出了新的E-Apriori和EH-Apriori算法来对这两种算法进行改良。新算法一方面减少了候选项集的产生,另一方面也拓宽了算法的适应面,使之适应于多维的关联规则挖掘。其次根据股票市场特点提出了多维跨交易关联规则的概念,多维即每个项目包含多个属性。本文以二维数据库为例,给出每个项目基本地址和相对地址的概念,来定义跨交易关联规则,并利用提出的E-Apriori和EH-Apriori算法来产生最大频繁项集,计算候选集的支持度和信任度,生成跨交易关联规则。然后用实验来检验算法的效率。最后本文利用实际中的数据来检验所做分析,并与实际情况做了对比,证明了本文所做研究的价值。如果能够在给定支持度的情况下得到所要关联规则,可以以此作为投资的依据。