基于Java的支持PMML的软件包研究与实现

来源 :中国农业大学 | 被引量 : 0次 | 上传用户:hongyanzhiji761112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,数据挖掘应用到了很多行业,产生了较好的社会效益,因此它得到了很好的发展。随着应用的不断扩展,数据挖掘系统之间进行挖掘模型交流的需求越来越强烈,而预测模型标记语言(PMML)的出现正好满足了这种需求。 本文在分析PMML标准的基础上,运用模块化设计思想、面向对象技术、Java技术和XML技术等开发了一个支持预测模型标记语言的软件包。该软件包可以提供对PMML文档的输入和输出,同时具有跨平台特性。本文主要的研究内容如下: 1、本文开发了一个支持预测模型标记语言(PMML)的软件包。本文通过对PMML标准及其应用环境的分析,提出了具体的开发需求,进而进行了系统总体设计、详细设计以及最终的代码实现。本文将对PMML标准的支持分为输入和输出两大部分,然后针对PMML标准的各个部分进行了相应的模块设计和实现。通过输出模块可以将挖掘模型导出,而通过输入模块则可以将挖掘模型导入,通过它们从而实现了挖掘系统之间通过PMML进行模型交换的需求,进而实现了对PMML标准的支持。 2、本文运用Java技术实现了软件包的跨平台特性,同时运用模块化设计思想和面向对象技术进行设计和开发。本文为了实现软件包的跨平台特性,选择了使用Java语言进行开发。同时设计了该软件包与其它挖掘系统的关系,便于进行整合。另外在设计过程中采用面向对象技术和模块化设计思想,将整个功能划分解为不同的模块,各个模块之间保持一定的独立性,降低了系统的耦合性,从而可以方便地对该软件包进行修改和扩展。 3、本文的PMML软件包实现了可配置性,是本文的一大创新点。本文通过采用JAXP技术为底层XML技术(DOM和SAX)的实现提供了一个可配置层。通过JAXP技术进行配置以后,可以方便对底层选用的XML解析器进行更换,同时不会影响上层的具体实现。通过对底层XML解析器的配置,可以增强本软件包的适应能力,也增加了软件包的灵活性。 4、本文最后通过两个应用例子来说明本软件包的使用,同时用来验证本软件包的基本功能,从而利用它满足了两个挖掘过程进行挖掘模型交换的需求。
其他文献
语义万维网(Semantic Web)是目前国际万维网联盟(World Wide Web Consortium,W3C)为了解决Web上的数据缺少语义信息而难以实现自动化处理的问题所开展的研究项目,其目的是为
计算机网络的飞速发展以及在各个领域的广泛应用,给人们的工作、学习、生活带来了极大的便利。但是网络在提供便利的共享资源的同时也带来了各种各样的安全风险。因此,网络安全
指令调度相关的优化是现代编译器后端的重要组成部分。本文就通用处理器龙芯I的编译器中机器模型、静态指令调度、和全局延迟槽调度等与指令调度相关的问题进行了研究。机器
随着Internet的迅猛增长,电子邮件作为最快捷、最经济的通信方式,也得到了飞速发展。但是,许多销售广告、快速致富等垃圾邮件也在网络中传送,这些垃圾邮件不仅占据邮件服务器的大
数据挖掘研究如何从大量的数据中智能地、自动地提取出有价值的知识和信息,是当前相当活跃的研究领域。近年来,随着我国铁路信息化建设快速发展,知识的自动获取已经成为制约其进
随着计算机技术的迅猛发展和电子技术的高速发展,个人电脑的价格也越来越低廉,应用也越来越普及。Windows系列操作系统在个人电脑上有非常高的市场占有率。在Windows上运行的软
综合信息系统集成平台是面向整个企业或组织的管理信息系统,它强调把整个企业或组织看成一个系统,按系统的观点去分析和处理信息流,实现各子系统间的紧密联系、相互制约和数据共
随着整个社会的信息化演变,企业管理者和IT人员对积累下来的数据、信息进行管理和利用的要求不断提高,集中于操作型日常事务处理的传统数据库系统已经不能完全满足现代企业的
信息系统将企业的物资流、信息流、资金流纳入统一的管理之下,使企业的资源配置更加合理,使信息在企业内部的传递更加通畅、快捷,提高了企业的管理水平和核心竞争力。 我国外
目前在海岸动力数值模拟研究领域,数值模拟计算和数值模拟后处理方面都有大量的研究成果,而数值模拟前处理方面却还停留在依靠人工方法读取纸质地图数据的阶段,因而基于组件式地