面向大数据征信的分布式计算系统的研究与实现

被引量 : 0次 | 上传用户:pboss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据征信场景中,数据具有超高维、海量、来源广泛、结构复杂等特点,征信数据中蕴藏着巨大价值,如何快速挖掘提取其中价值是征信从业人员普遍关注的问题。随着大数据技术的蓬勃发展,业界涌现各种计算引擎,大致包括批处理和流处理两类,用于解决不同业务场景。利用大数据创新征信服务,对于拓宽征信市场的广度和宽度十分有利,大数据征信的发展趋势具有客观必然性。但是在大数据征信场景中,任务具有实时和离线相混合的特性,经过前期技术调研与分析,单一的分布式计算引擎无法满足日益增长的需求,在任务开发和资源管理方面存在问题,因此对面向大数据征信的分布式计算系统提出如下挑战:(1)复杂任务开发成本高、系统维护难、代码复用性低;(2)分布式资源管理不够灵活,调度策略固定,未充分考虑任务性质和集群负载情况;(3)缺乏统一可视化的分布式计算系统,大数据征信分析过程不够便捷灵活,数据价值生产效率低。针对上述问题,本文内容重点围绕任务开发和资源管理进行探索和分析,并进行面向大数据征信的分布式计算系统的研究与实现,主要研究内容包含如下三项:(1)设计并实现了批流统一的可视化业务流开发工具:基于Apache Beam进行批流统一编程,复杂任务可通过任务进行上下依赖连接构成复杂业务流,构建完成后可选择合适的分布式计算引擎进行业务流执行,该工具增强项目代码复用性、减少复杂任务的开发成本、便于大数据征信服务开展;(2)探索并实现基于混合任务的动态调度策略:基于Hadoop YARN作为大数据资源统一管理器,在资源管理中充分考虑任务性质并划分离线和实时双队列,以此提高二类任务的公平调度性;充分考虑队列资源压力情况,根据负载变化进行动态策略调整,从而达到在不同情况下适度降低任务执行和调度时间的目的;(3)设计并实现面向大数据征信的分布式计算系统:为大数据征信开发人员构建基于Web统一可视化的开发环境,同时提供数据管理、任务管理、资源管理三大能力。本系统的研究依托于国家重点研发计划“大数据征信及智能评估技术”,在大数据征信的场景下提供数据管理、任务管理、资源管理一体化的分布式计算系统,同时验证本系统的有效性和实用性。
其他文献
财务管理在企业的经营和管理过程上日趋重要,对企业实现战略目标至关重要。随着近几年信息化建设的飞速发展,特别是信息化融入于企业日常经营管理的程度的加深,企业势必需要加强财会信息化建设,提升企业财务管理质量,避免企业滞后于经济发展。但在财会信息化建设中依然存在着诸多问题尚未解决或完善,导致企业管理效率及质量不高。本文通过对企业财会信息化建设中存在的问题予以剖析,并针对性提出完善方法,以期为相关企业开展
期刊
由于染料废水的污染程度极为严重,可生化性差且色度高,其中包含多种有害的有机污染物,而这些污染物质的构成又十分复杂,使得染料废水的污染问题变得极其严峻。此外,染料废水中的染料随科技的进步稳定性能越好,不易被降解,染料废水的污染排放标准也在愈发严格,因此寻找一种能够有效减少污染物,同时满足国家环保要求的技术显得尤为重要。三维电极电芬顿技术是三维电极与电芬顿技术的结合,能够实现多种电化学氧化过程,包括阳
学位
红色文化蕴含着丰富的教育价值,是学校对少年儿童开展革命传统教育、爱国主义教育、人生信念教育的优质资源。红色文化融入语文课堂不仅能传承和弘扬红色文化,还能培养学生健全的人格。文章从提升教师红色文化传承意识、优化语文教科书红色文化传承内容、强化课堂教学中红色文化渗透、在课外红色文化活动中塑造人格等方面,对红色文化融入语文课堂的途径进行论述,以促进红色文化的传承和发展。
期刊
对石墨毡进行电化学聚合吡咯改性,考察聚合时间、脉冲次数和间隔时间对聚吡咯改性石墨毡电极形貌结构和电化学性能的影响。结果表明,通过聚合脉冲时间、脉冲次数和脉冲间隔时间可以调控聚吡咯涂层的厚度、形貌和亲水性。在聚合脉冲时间为100 s、间隔时间为120 s,脉冲次数为10次的条件下,得到的聚吡咯改性石墨毡电极的2电子氧还原活性最高,其电化学活性比表面积最大,达到1.502 8 cm~2/cm~3,在p
期刊
进入新时期,现代化信息技术实现了迅猛的发展,国有企业财务管理工作也实现了进一步的创新发展。国有企业财务人员通过运用信息化技术对管理流程进行了优化,财务管理不需要投入过多的成本。本文首先阐述了国有企业财务信息化建设的概念及其重要性,然后深入分析了我国国有企业财会信息化建设的问题,并提出了相关的改进措施。通过本文的研究,希望可以帮助国有企业转变新型财务管理模式,运用智能化信息技术发挥主观能动性,打造全
期刊
针对不锈钢超薄板冲压件的变形开裂问题,以燃料电池金属双极板为研究对象,首先,根据双极板的功能和特性,设计了一种具备拉延加强结构的可冲压金属双极板,通过CAD软件建立了双极板的三维模型。其次,利用有限元模拟技术,选择初始板料尺寸、压边力、冲压速度以及模具间隙作为成形质量的影响因素,以金属双极板减薄率及增厚率作为优化目标,进行冲压模拟,并给出优化目标随着影响因素的变化规律。同时,分别求解金属双极板成形
期刊
随着我国科学技术的蓬勃发展,企业财务工作正面临着创新和变革,同时财务管理模式也发生了改变,财务管理效率和质量得到了有效提升。采用信息技术可以对财务管理进行改进与创新,优化管理流程,降低财务管理的投入成本。然而,企业在开展财务会计信息化建设的过程中,还存在一些问题需要解决。企业工作人员需要发挥自身的主观能动性,熟练使用信息技术开展财务会计工作,对财务风险进行有效防范,从而提高财务管理水平。
期刊
自改革开放发展以来,我国社会主义市场经济发展的速度不断提升,越来越多的中小企业也成为我国国民经济中具有较强活力的主体。但是受到多种因素限制,我国桥梁工程企业发展的实际过程中,财务信息占据着较为重要的地位,决定企业财务管理的质量。基于此,本文对桥梁工程企业财会信息化建设的重要性进行分析,分析财会信息化建设中存在的亟待解决的问题,并提出完善措施,希望可以提升桥梁工程企业财会信息化建设质量。
期刊
目的 探讨前蛋白转化酶枯草溶菌素9(PCSK9)抑制剂联合中等强度他汀类药物在不同危险分层动脉粥样硬化性心血管疾病(ASCVD)经皮冠状动脉介入(PCI)术后的应用效果及安全性。方法 回顾性分析2020年1—6月收治的ASCVD经PCI术后应用PCSK9抑制剂联合中等强度他汀类药物治疗的200例的临床资料,依据危险分层分为超高危组和非超高危组,每组100例。所有患者在中等强度他汀类药物治疗的基础上
期刊
目的:冠状动脉慢性完全性闭塞病变(chronic total occlusion of coronary artery,CTO)是动脉粥样硬化病变(atherosclerosis,AS)逐渐发展至终末阶段的严重血管狭窄病变。CTO具有发病率高、早期难以识别、病变结构复杂、介入手术操作难度大、再通率低、病死率高、预后差等特点。早期识别及对其预后的评估尤为重要。大量研究显示,超敏C反应蛋白(Hyper
学位