论文部分内容阅读
随着科研管理工作的信息化,科研管理各类数据快速增长和积累,海量科研管理数据远远超出科研管理人员的理解和分析能力,传统的统计技术和数据管理工具已经无法满足科研管理人员的数据分析需求。 面对海量的数据,科研管理人员希望开展更深入的数据分析,挖掘其中蕴含的价值,有效地利用这些数据。然而,现有的科研管理数据分析,其工作重心仅在于“统计”,“分析”功能局限,不能有效服务于管理决策咨询。为了实现对科研管理数据的深入分析,本文构建了一个简便、高效、可扩展的数据挖掘平台。 本文首先对科研管理数据分析的现状进行调研,了解当前数据分析中存在的不足,并结合数据挖掘领域中的理论,梳理出数据挖掘平台的需求;然后采用B/S模式,基于JavaEE框架,以Oracle数据库作为数据仓库,以开源的Lucene全文检索引擎和Mahout机器学习框架作为数据分析与挖掘工具,以D3和Highcharts JS作为数据可视化工具,按照软件工程的流程,完成了数据挖掘平台各部分的分析、设计与实现;最后,对平台进行整体测试和应用分析,以确保各功能模块的准确性和健壮性。本数据挖掘平台基于开源框架开发,极大地加快了平台的开发周期,提升了平台的可移植性、可扩展性和可维护性。