分布式异构数据源同步框架的研究与实现

来源 :天津理工大学 | 被引量 : 5次 | 上传用户:rurucaihongru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展、智能终端设备的普及,网络上产生的数据在不断的激增。计算机存储技术伴随着数据时代的到来也在迅猛的发展,硬件方面,数据存储介质在继续改进和出新;软件方面,基于各种设计思想、架构方案的存储系统在陆续的出现。在这样一个数据驱动的时代,数据的价值也在不断的突显。然而在实际发展过程中,我们对数据的需求和应用并不是一成不变的,数据产品在设计初期的架构也不一定是绝对完美的。例如,产品底层数据架构是用于存储用户交互的数据,但是随着数据的增加和业务的发展,这些数据将会用于某些业务场景下的决策分析或可视化展示,此时,原有产品的底层数据架构,就不足以完全支持新有的业务,因此,可能需要引入新的存储系统来进行改善。在这种场景下,异构数据源之间的数据同步和迁移的需求就逐渐的显现出来。目前,现有的一些工具大多数只为完成与某种固定的数据存储系统进行数据同步和迁移而存在,在多种异构数据源的支持上并不是很完善;其他一些针对异构数据源之间进行数据同步的工具并不支持分布式运行,导致在海量数据同步的场景下存在单机性能瓶颈的问题。本文从数据同步需求入手,对各种应用场景进行深入研究和分析,提出了一种针对各种异构数据源之间进行数据同步的技术解决方案,该方案汲取了现有的一些数据同步工具的优秀设计思想,通过采用分布式、服务化等方式,使得在解决单机性能瓶颈、实时数据同步以及定时同步等业务场景的时候能有更好的支持。针对提出的技术解决方案,本文实现了基于它的数据同步框架。在使用方式上,该框架以一个中心化服务来运行,服务由多个服务器节点构成的集群来提供。整个服务框架一旦开启,就会一直运行,等待具体同步任务的上传。使用者通过框架提供的SDK来对具体的同步任务进行Job开发,而后将Job提交至服务集群,集群在接受到Job后,经解析、验证等复杂预处理操作以后便会进行相关数据源之间的数据同步工作。最后,本文对所实现的框架在不同数据集上进行了性能测试,并将测试过程中所收集的各方面数据进行了汇总和梳理。通过对这些实验数据的分析,同时结合框架的工作原理,本文对在测试过程中发现的问题进行了解释和说明,同时为后续框架的继续优化指明了方向。
其他文献
由于实体和虚拟经济之间是相互依存,并且相互之间会造成一定的影响,如果实体经济和虚拟经济这二者之间发展相背离,那么将会造成十分严重的金融危机发生,进而对社会经济造成极
目前很多商学院还是以要求学员修读各门课程的形式来进行MBA教学,可是为什么不能考虑增加一些以项目为导向进行的教学活动呢?
研究了ZnO不同含量对ZnCr2O4湿敏陶瓷线性度及LiCl、AlO3、CaCO3掺杂对湿阻特性的影响.实验表明:过量的ZnO含量可改善湿敏陶瓷的线性度,Ca2+的加入可提高湿敏陶瓷的机械强度,
目的 观察盖诺(NVB)加顺铂(DDP)(NP方案)化疗联合放疗治疗中晚期鼻咽癌的临床疗效及不良反应.方法 62例Ⅲ、Ⅳ期鼻咽癌患者随机分为两组,放化疗组在放疗前、放疗开始后3周及放疗结
目的总结中晚期肝癌肝动脉灌注化疗栓塞术后情况疗效。方法采用seldinger技术,经皮股动脉插管进行肝动脉灌注化疗药物栓塞剂。结果术后1~4周AFP下降〉15%。术后4周肝CT或肝动脉
目的探讨椎管内硬膜外神经鞘瘤的临床表现特点及治疗方法。方法本文收集1989~2004年期间椎管内硬膜外神经鞘瘤26例进行回顾性分析。结果多以神经根痛为首发症状,继而出现感觉、
集成了传感器技术、微机电系统技术、无线通信技术和分布式信息处理技术的无线传感器网络是一种全新的计算模式,是继因特网之后将对21世纪人类生活方式产生重大影响的IT热点
目的:本实验通过CBCT影像资料研究,探讨伴有或者不伴有下颌偏斜成人骨性Ⅲ类错牙合患者双侧颞下颌关节形态及位置的对称性,以期对这种颅面畸形有更进一步的认识,并为临床上此
RV传动装置是一个虚约束度为7的静不定系统。其机构尺雨的制造偏差将会严重地影响春内部作用力的分布,机构尺寸偏差,作用力分布和其内部弹性因素的弹性位移这三个因素制约于一个复
以matlab为平台,应用遗传算法和matlab工具箱中的统计函数,通过求解还原洪水过程与实测洪水过程之差绝对值的加权之和最小化问题来优化估计瞬时单位线的参数,避免了用近似公式法