PMML研究与数据挖掘系统平台设计

来源 :重庆大学 | 被引量 : 0次 | 上传用户:chrisl0708
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系数据库的广泛使用促成了数据挖掘技术的诞生。数据挖掘系统在金融业,电信和零售等有着巨大的应用前景。随着大量数据挖掘系统的使用,不同的数据挖掘系统开发商之间,不同的研究机构之间以及系统开发商和研究机构之间迫切需要一个与SQL之于关系数据库系统类似的数据挖掘语言出现。但是,数据挖掘语言至今仍然没有一个统一的标准。不同研究机构或公司使用的主要有数据挖掘查询语言(DBMiner的DMQL)、数据挖掘建模语言(OMG的PMML)和通用数据挖掘语言(Microsoft的OLE DB for Data Mining)等。 本文介绍了数据挖掘的概念和功能,并对数据挖掘系统和相关技术的发展进行了分析与讨论,介绍并分析了预言模型标记语言PMML。 本文在研究软件体系结构的基础上,设计了一个数据挖掘系统平台,给数据挖掘技术的研究者提供一个研究用的实验平台。只要遵循该平台的数据模型接口和挖掘模型接口,新的数据挖掘算法可以很容易地集成到该平台中去。同时,该平台又是一个具有实际应用价值、可以与数据挖掘应用紧密结合的、便于升级和移植的数据挖掘系统框架。将数据挖掘系统实现技术与最新的PMML标准结合起来,采用组件技术设计,使得系统具有良好的开放性和可扩展性。 系统的设计主要包括数据服务器、挖掘服务器和专家服务器三部分。数据服务器代表了系统的数据抽象,包括元数据的表示和数据的存取接口。挖掘服务器实现系统的挖掘功能。通过对各种挖掘功能进行抽象,建立了以TMiningAlgorithm为基类型的挖掘算法类型体系结构。
其他文献
无线局域网是计算机网络和无线通信技术相结合的产物,其具有可移动性强、成本低、能显著提高工作效率等优点,因而存在着巨大的应用市场,目前已成为商业网络中一个必要的组成
工作流管理系统是用信息技术、现代管理技术及先进设计制造技术改造传统制造业、加强新兴制造业、提高企业市场竞争力的系统化技术,也是我国企业实现现代化的一条有效路径。
无线传感网络以其自组网、低功耗、传输稳定等特点已被应用于检测平台、预警系统、甚至是高度危险无人区的监控系统。然而,能耗问题阻碍着无线传感器网络的发展和应用。在网络
自由曲面的重建在许多领域有着广泛的应用,并提出了许多有效方法和应用技术,而其最终目的就是要获得自由曲面的计算机模型。1995 年,P.Gu 和X.Yan提出利用BP 神经网络重构自
随着网络的发展,网络与计算机越来越广泛的使用在现今社会,电子银行、电子商务等网络服务正在悄悄地进入人们的生活。与之俱来地,网络攻击也在不断地增加,人们现在已经认识到
随着现代企业信息化要求的提高,大多数企业内部都有着各种各样的应用系统,它们是由不同的软件开发商开发,运行在不同的平台和系统上,系统的开发语言也各不相同,因此各个企业
随着社会的发展、科技的进步,对方便、可靠、自动身份鉴别的实际需求日益迫切,生物特征识别特别是人脸识别已成为机器智能研究的热点问题。研究人脸识别,其意义不仅仅在于推
本文首先根据工厂车间生产模式给出了基于工序模式的遗传算法编码设计方式,并且基于这种编码方式对车间作业调度的成本模型做了优化。 然后本文以一个简单例子,讨论了车间
以信息化为主要标志的第五次产业革命,正在引起人类生产方式、生活方式和价值观念的深刻变化,数字化、智能化的家居生活成为人们追求的目标。智能家庭网络利用多种传输介质将
在国内外,家庭智能经过十余年的发展,得到越来越多人的青睐。但是,目前市场上的家庭智能系统还存在很多不足,因此,开发一个全新的家庭智能系统迫在眉睫。 在本论文中,研究