论文部分内容阅读
目的探索大数据处理方法及技术在医疗服务大数据领域中的应用,提高交互式统计计算效率,从而为医疗服务大数据的进一步挖掘和利用提供第一手的实践资料。方法梳理了医疗服务大数据的来源范畴、数据特征及其处理技术的发展,围绕大数据时代下的医疗服务数据统计、分析及利用的功能和性能需求,并提出了一套基于Spark的并行计算解决方案。结果完成了医疗服务大数据交互式分析平台的系统架构设计,以Spark计算平台为基础进行了统计系统原型的实现、对比和验证。结论Spark能够满足医疗服务大数据处理中以交互式查询为代表的统计分析的数据