【摘 要】
:
随着信息技术的不断进步,企业内部产生了越来越多的数据。快速增长的海量数据收集存放在大型和大量的数据库中,没有强有力的工具,理解它们已经远远超出了人的能力。基于数据
论文部分内容阅读
随着信息技术的不断进步,企业内部产生了越来越多的数据。快速增长的海量数据收集存放在大型和大量的数据库中,没有强有力的工具,理解它们已经远远超出了人的能力。基于数据仓库的联机分析挖掘(On-Line Analytical Mining,OLAM)技术越来越多的被引入到现代企业的决策支持系统中,为企业决策者提供方便快捷的决策支持。然而,OLAM中数据统计分析和数据挖掘所需的数据基础通常是多样的,对数据处理的准确性和效率要求比较高,传统的OLAM中产生的大量多维数据集使得数据挖掘的功能受到限制,挖掘算法效率低下。针对上述问题,本文主要做了以下工作:对数据仓库环境下的决策支持系统进行了深入分析,设计了一种基于工作仓库和多维关联规则挖掘的OLAM系统框架,并对框架的各部分功能及关键技术进行了说明。给出了整个系统的运行流程,并分析了它的主要特点。分析了当前数据仓库环境下的联机分析挖掘存在的瓶颈和缺陷。阐述了工作仓库的设计要点,运用数据缓存技术对一些频繁使用的数据集进行了处理,以达到及时获取数据和减少对数据服务器I/O操作的目的。本文提出了一种新的数据缓存算法,保证了工作仓库中数据的有效性和高可靠性,提高了工作仓库缓存池中数据的命中率。针对传统OLAM系统中数据挖掘的维度单一和低效的缺点,设计了一种多维关联规则挖掘模型,提出了一种未剪枝的Apriori多维关联规则挖掘算法。通过增益指标评定标准,推导出了用户感兴趣的强关联规则,提高了挖掘结果的准确性和多样性。本文研究成果已初步应用于某海事局船务决策支持系统中。应用结果表明,海量船务数据分析统计的时间大大缩减,分析结果的准确性得到了明显提高,为管理层决策提供了强有力的支持。
其他文献
车辆牌照识别是智能交通系统(ITS)的一个重要组成部分,本文针对目前车牌识别算法的局限性,主要研究了复杂环境下的车牌识别技术。
本文首先介绍了车牌预处理和定位。针对
本文以国家高科技研究与发展专题课题(“863”课题)“互联网环境下基于闭环反馈的服务描述、发现和管理技术研究”(课题编号2007AA01Z139)项目为背景,对SOA系统中的基于服务
空间数据库管理系统是随着数据库技术的发展及新的应用需求而兴起的一种新型数据库管理系统,具有十分广阔的应用前景。如何在数据库中表示空间数据、存储空间数据、有效地处
乳腺癌仅次于肺癌,成为威胁妇女健康的第二大全球性疾病,早期诊断和早期治疗是降低乳腺癌患者死亡率的关键。微钙化点在乳腺X线影像上表现为独立或成簇分布的亮点,它们是乳腺
视觉问题是科学领域和工程领域中一个极富挑战性的研究课题,具有重要的理论意义和广泛的应用前景。一般物体识别则是计算机视觉领域的一个相当困难和基本的问题。目前为止,虽然
分布交互仿真系统技术复杂、开发周期长。如何使仿真技术平台对仿真应用开发人员透明;如何重用已有的仿真实验框架和模型。这是分布交互仿真系统开发亟待解决的两个问题。MDA
Internet在网络环境下得到了广泛的应用,语义web应用到网络资源描述和知识库的建立,成为计算机界和知识工程界的热点。本文从另一角度,将语义web成果与领域软件工程相结合,在
生物识别技术是利用人自身具备的生物特征进行身份鉴别的技术。与其他的生物认证技术相比,人脸识别具有更直接、友好、方便的优点。因此,人脸识别技术有着广泛的应用前景和迫
大型矩阵计算广泛应用于飞行器的设计、航天器设计、桥梁设计、生物科学、计算物理和石油勘探等领域。随着矩阵阶数的增加,矩阵求解和求特征值等问题的计算量和存储量将会急
交通流元胞自动机模型是20世纪90年代涌现的交通流新的动力学模型,它的出现和发展为交通流理论研究提供了一种新的方向,为交通流动力学理论中的系统整体行为与复杂现象的研究提