论文部分内容阅读
在实际开发企业级应用中,人们经常需要面对对分布式数据进行机器学习的需求。本文实现了一个集成有机器学习分布式数据功能的J2EE集成框架,在此框架结构上,能够快速、方便的开发出需要机器学习分布式数据的企业级应用。
对于J2EE项目,开发框架的选择是决定项目成败的关键因素之一。本文实现了表现层使用基于组件的Tapestry,业务逻辑层使用Spring,数据持久层使用Hibernate的J2EE开发平台。
支持向量机作为一种新的机器学习方法,在处理单点数据的机器学习中得到广泛应用。本文实现了抽象的使用支持向量机的机器学习模块,并将其用于处理分布式数据。
本文构建了一种基于自定义序列化的JavaRMI——SlimRMI。SlimRMI用自定义的序列化方法,将要传输的对象与已传输的对象相比较,使得只在网络间传输对象变化的部分。该方法解决了传输过但值未变化的对象的重复传递问题,有效的减少RMI通过网络传输的字节流的长度。
本文运用设计模式,实现了使用支持向量机的机器学习功能与Spring的集成。集成中充分利用Spring的控制反转思想,使只通过简单的配置和开发,就可实现机器学习的需求。同时针对分布式数据问题,使用SlimRMI将数据传输到同一地点进行机器学习。基于该框架,开发过程简洁,而且开发出的应用具有良好的性能。