基于DMX语言的数据挖掘算法包原型系统的设计与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:allenwyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来计算机信息技术的飞速发展,数据挖掘技术在企业管理决策等活动中扮演着越来越重要的作用。相当多的大型企业其内部或者与其他商业伙伴间海量的数据需要在数据挖掘技术与平台下成为有意义有价值的知识信息。20世纪80年代数据挖掘技术开始萌芽,经过了90年代的高速发展,现在各种数据挖掘平台技术、商用软件以及数据挖掘算法已经层出不穷,特别是数据挖掘商用软件的出现和不断完善,使得大型企业在企业管理和决策活动中有着更为有利的依据。在对海量的业务数据进行不断的挖掘并发现内在的模式、规律和趋势后,企业在市场上的决策也有了更加明确的方向,也极大的降低了不必要的战略风险。但是,目前存在着大型企业能够享用计算机信息技术和数据挖掘技术飞速发展的最新研究和应用成果,而中小企业普遍不能够获得满足其自身业务需求的相关系统与软件技术,如Warehouse Mine、Enterpris Miner这种业界领先的集成度相当高的数据挖掘软件的价格和适用程度对它们而言都不合适,同时中小企业随着其企业战略的发展与变化,对自身适用的这类软件的结构灵活性、功能开放性和操作独立性的需求也十分迫切。因此,如何在开源平台下设计并实现一种具有功能开放性、操作独立性和结构灵活性等特点的数据挖掘软件来满足中小企业对其内部大量业务数据进行数据挖掘以期发现有用的知识的需求,正是文中所研究的课题的目标和意义所在。诚然,近年来Teradata、SAS、IBM和Oracle等公司都推出并不断完善了自己的商用数据挖掘软件,这些软件在功能和性能上已经接近完美,从数据仓库的构建到前端数据挖掘工具的应用,已经能够很好地满足用户的实际需求。但是如何能统一并规范一种数据挖掘语言仍然是目前业界普遍关注的难点/热点课题。其中,微软公司所提出的OLE DB for Data Mining规范和DMX数据挖掘语言已成为该课题的具有代表性的解决方案之一,它代表着数据挖掘技术沿着标准化的进程正日趋成熟。文中从相关理论基础着手,从基于数据仓库的数据挖掘理论、方法与技术引出OLE DB for Data Mining规范和DMX语言的发展历程,阐述了当下热门的数据挖掘技术研究课题。然后从中小企业对数据挖掘软件的实际需求出发,叙述了文中对设计与实现基于DMX语言的数据挖掘算法包原型系统所采用的技术手段和框架的特点与优势。接着文中从软件设计方法的角度详细叙述了基于DMX语言的数据挖掘算法包原型系统的设计与实现过程。最后,文中把该原型系统与当下主流的微软SSAS中的数据挖掘工具平台的结构特性上作了优劣分析并比较,并对进一步的工作目标和深入研究的内容进行了展望,以期对数据挖掘平台与技术的各方面的工作做一个抛砖引玉的作用。
其他文献
实时系统的能耗问题一直是研究的热点。节能可以通过软件和硬件的手段来实现。到目前为止,大部分的软件节能都是基于动态电压调整DVS(Dynamic Voltage Scaled)。不过,最近的
信息技术的发展导致了数据爆炸式的增长,存储系统的规模达到了EB级,文件的个数也高达几十亿个。这就使得在大规模存储系统中查找和管理文件变得异常困难,因此复杂元数据查询
Web挖掘是数据挖掘领域中一个新兴的研究方向,而Web日志挖掘是其中的一个重要的研究内容。Web日志挖掘是通过将数据挖掘技术应用于Web服务器日志文件,以得到Web用户的访问模
数据库管理系统是目前各种大型应用系统中的核心支撑软件,其可靠性和正确性是这些系统的稳定能否稳定运行的重要因素。锁机制是数据库管理系统中并发控制的关键技术,其正确性
随着中国游戏产业增长迅速,网页游戏以其运行便捷,技术上的突破带来游戏体验的不断提升,使得网页游戏发展迅速,成为网络游戏的重要组成部分,市场份额不断扩大,其中网页MMORPG
我国曾多次遭受风暴潮袭击,是世界上风暴潮灾害发生最频繁且所受影响最严重的国家之一,风暴潮给我国国防、工农业生产和国民经济带来重大的损失。对风暴潮灾害的数值模拟方法的
学位
与传统集群相比,在云平台上运行高性能应用有着低廉的计算成本、方便高效的管理模式、多用户的环境隔离与定制等诸多优势,尤其对中小规模高性能计算用户而言优势更加明显。但
基于构件化的软件开发(Component-Based Software Development,CBSD)已经成为目前软件开发的主流技术,同时相关的技术研究也成为软件工程领域的重要研究内容。构件开发方会对
基于图像序列的三维建模方法由于真实感强、成本低廉、自动化程度高等优点,已被广泛应用于电影、视频游戏、文物保护、地球科学等诸多领域。然而,建模时间长、消耗资源多一直
碑文拓片图像分割的目的是将图像中具有历史和研究价值的文字或图形从背景中分离出来,使之能够被识别和理解,以进一步分析研究,这对历史文物的保护和文化的传承有极其重要的