论文部分内容阅读
随着保险公司计算机系统应用的不断推进,保险公司提出了对数据进行深入分析和应用的需求。国内很多保险公司在开发自己的数据分析系统。但是保险公司数据分析系统的开发并不顺利,失败率很高。表现在很多数据分析程序开发在没有交付使用的时候就夭折了,或者用户在使用半年到一年时间后就停止使用。前期保险公司的软件需求大部分是工作流程的信息化,需求和实施步骤明确,程序设计和实施进展基本顺利。与前期的软件设计不同,数据分析是一种知识发现的过程:用户的目标是从大量的数据中获得对自己有用的知识,但是能获得什么知识或者怎么去获得知识,用户往往是很难描述清楚的。有时候这种过程还是交互的:因为在数据中发现了一些有用信息,用户才能进一步提出新的需求,而且这种需求是根据获得的信息不同而不同。为了设计一套可以被保险企业良好应用的数据分析程序,本文进行了以下工作:总结目前大数据思想的发展现状,主流思想与目前的局限性;归纳运用大数据思想设计数据分析程序的一般做法与其利弊;结合保险公司的数据分析目标与大数据思想设计一套数据分析程序,主要解决了保险公司数据分析中的信息孤岛问题、程序可扩展性问题、程序幵发周期过长问题以及将数据分析需要的专业知识整合进系统,减少对数据分析程序操作人员专业度要求。数据分析程序设计时,改变以往以用户需求为驱动的模式,设计程序时不再被动的接受用户的需求,而是更关心信息、用户和他们之间的关系。收集多平台,多来源的数据源,建立有效的清理与整合机制,在此基础上构建为数据分析服务的统一的多维度的数据集市。提炼出一批可以应用在保险公司数据分析的算法,将比较复杂的精算模型,医学知识等整合进分析算法模型中,使最终用户不用熟知算法和一些背景专业知识就可以得到比较专业的分析结果。数据分析程序采用分段式开发方法,每一个小的阶段都有阶段性的成果可以应用到业务中,避免太过宏大的目标导致的任务失败,并且可以持续进行优化。目前该数据分析程序可良好的服务于企业的决策支持、保单率赔付预估、业务品质分析与预警等方面。