面向保险大数据的实时看板系统设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zxhouxingzx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着保险行业业务发展的不断扩张,传统保险行业急需一种更加有效面对日益增长的海量数据的处理方法。然而在国内的传统保险行业当中,面对如此海量的数据,利用效率却依然具有很大的局限性。大数据技术和数据可视化的出现,使得对海量数据的利用取得了巨大的突破。本文针对目前大数据实时看板的发展现状,结合Hadoop的开源大数据生态与Spark计算框架,基于B保险公司的具体业务项目,通过梳理设计业务场景的数据模型,设计了专门针对该保险公司业务的新型ETL数据处理方案,并设计与开发了结合数据存储、数据处理和数据应用的完整保险大数据实时看板系统应用。首先,文本通过查阅目前国内外的保险行业发展以及大数据相关技术的研究现状,通过对比分析几种常见的数据处理框架,选择了开源、稳定、能够同时处理实时以及离线数据的Spark计算框架;接着,本文详细研究了Hadoop平台的MapReduce处理机制,HDFS分布式系统以及Hive数据仓库三个方面的内容,并介绍了在Spark实时计算当中会涉及到的Kafka消息队列,Spark Streaming和Hbase数据存储相关的技术,为后续实现具体系统功能打下理论基础;然后,本文对功能性需求和非功能性需求的分析主要来源于保险大数据所涉及的具体业务逻辑和使用场景,接着对该系统的整体技术架构和逻辑架构进行了设计,并对基础数据层和分析数据层进行了详细的设计;在此基础上本文对大数据实时看板的处理模块所涉及的具体功能进行了详细的设计,包括对保险数据流向的新型ETL任务的设计、实时数据以及离线数据的新型版本控制方法设计、在实时处理过程当中的新型异常数据回退处理方法、以及数据聚合和汇总的方法设计等。在数据应用模块当中,本文通过对最具本系统代表性的全流程理赔监控以及报表可视化的功能进行了设计与说明。然后本文针对具体的系统实现过程,给出了本次系统所涉及的四个模块的时序图和流程图,对涉及重要设计部分的类进行了具体的解释说明,并以具体的业务使用场景对系统的功能使用进行了细节补充。然后在本文的测试部分,主要对系统的数据准确性和可靠性部分进行了测试,同时也对数据应用模块看板部分以及监控功能进行了测试,并对其可用性、易用性、实时数据处理能力进行了论证,结果说明本系统可以满足B保险公司,日活在千万级别的数据处理水平。基本能够满足日常使用和需求中的各种业务场景。最后,本文总结了全文的内容,分析了本系统设计以及在具体使用过程当中尚有的不足之处,并展望了本系统在下一步可以提升的部分,以及未来保险大数据的其他应用方向。
其他文献
随着通信与电子信息技术的发展,天线在无线通信系统中的作用越来越重要。与此同时,对天线测量技术的要求也越来越苛刻,比如更高的精度和更大的带宽。一方面,球面近场测量因为不存在截断误差,可以得到待测天线完整的方向图等优点,在高精度天线测量方面得到了广泛应用。另一方面,球面近场测量的常见探头是矩形波导、圆波导、电偶极子等窄带天线,难以进行宽带测量。如果使用喇叭天线或者对数周期天线等宽带探头进行测量,则相应
空间环肋天线是一种典型的索网-桁架天线,为兼顾天线大口径、小收拢体积与高精度的发展需求,桁架由一系列细长杆组成,用于支撑索网结构,其中,细长杆具有高拉压刚度,但是弯曲刚度非常小。当杆受弯时,桁架会发生变形,这导致索网形面精度变差。为使索网具有高形面精度,本文基于“张拉整体”的结构特点,以索受拉、杆受压为约束,提出了适用于旋转抛物反射面和赋形反射面的空间张拉式环肋天线的几何-预张力设计方法。(1)针
近年来,卫星通信技术朝着高通量、终端小型化和移动化方向快速发展,新一代DVB-S2X标准因具有带宽利用率高、信道频带宽、传输信息量大和传输能力强等优势而得到广泛关注。DVB-S2X标准能支持多种调制编码方式、甚低信噪比模式和超帧模式,从而可以满足高通量卫星和小型移动终端的传输需求。对于不同应用场景,DVB-S2X标准定义了支持连续系统的标准帧结构和支持突发系统的超帧结构,针对这两种不同结构,本文研
合成孔径雷达(Synthetic Aperture Radar,SAR)成像技术有着全天时全天候的独特优势。SAR图像的质量也随着成像技术发展逐步提高,但其固有的成像模式和相干斑导致SAR图像的解译比光学图像更困难。图像分割作为SAR图像解译的重要技术之一有着重要的现实意义,因此有必要发展适用于SAR图像的分割技术。近年来,关于SAR图像分割的方法层出不穷、种类繁多。但由于真实场景SAR图像的复杂
微处理器作为信息处理系统中的运算核心,在高性能计算、信号与图像处理等领域获得了广泛的使用。浮点处理器作为微处理器中的重要部件,对微处理器的性能起着重要的作用,而超越函数作为浮点运算的一种重要类型,其运算的速度与精度都会影响处理器系统的性能。针对雷达信号处理、无人机飞控等领域对超越函数浮点运算的高精度和实时性需求,设计高性能的超越函数浮点处理器具有重要的工程应用价值。本文在分析国内外现有研究的基础上
大数据正以指数级速度增长,其中大量数据是文本数据。文本数据作为传递信息的主要媒介,对文本信息的存储、传输和检索的成本急剧上升。因此需对文本进行压缩以节省存储传输成本,同时建立支持高效检索的压缩索引。压缩自索引已广泛用于许多字符串处理应用程序中,例如信息检索,基因组分析,数据挖掘和Web搜索。索引不仅索引数据,并且采用压缩形式对数据进行编码。而且,索引和它编码的数据可以直接操作,无需解压缩整个索引,
云计算以其强大的存储空间和快捷的计算服务吸引了各行各业的广泛关注.数据存储在云上,数据所有者失去对数据的直接控制,数据的机密性和访问控制问题随之而来.属性加密能够实现密文数据的细粒度和非交互式访问控制,因此被认为是解决上述问题的有效加密技术之一.在属性加密中,用户的密钥可能被窃取、丢失或者用户离开系统,此时应当及时地撤销用户的访问权限以确保数据的机密性.另外,数据加密后存储在云服务器上虽然保护了数
在互联网时代,公司都希望获取用户使用产品过程中的数据,希望通过分析用户数据来改进产品。在公司原有项目中,用户数据分析的各个功能是彼此独立的功能模块,无法充分发挥其价值。随着公司对用户数据分析的重视,为更好的利用原有的与用户数据分析相关的功能模块,项目组决定对原有的功能模块进行整合,搭建一个整体的用户数据分析平台。由于原有的功能模块相互独立,存在功能耦合严重、功能重用率低以及稳定性差等问题。因此,项
社区警务是当下警务工作中最为基础的且重要的组成部分,极大的影响了整个城市的警务系统发展与建设。近些年随着不断增加的人口数量,不断增大的房屋居住密度,数据获取的来源变得更具有多样性和复杂性。智慧时空社区警务系统开发是受武汉市某区公安局委托,旨在打破传统警务管理模式,充分利用共享数据信息,拓宽警务管控网络的情报和信息传递渠道,增强警务协同联动工作能力,综合优化社区警务资源配置。智慧时空社区警务系统利用
分布式系统是处理大规模任务的主要平台,可以高效地处理大数据任务和计算密集型任务,能够通过并行计算有效缩短任务完成耗时。随着分布式系统网络规模的不断扩大,参与任务计算的处理机数量不断增加,即使每个处理机都具有良好的鲁棒性,当分布式系统中处理机数量增长到成千上万个时,处理机的平均故障时间也将从数百天缩短至几小时或更少。当参与计算的处理机因内部错误、网络攻击、网络瘫痪等原因发生故障时,该处理机将不能再继