服务大数据管理和抽取的元数据设计和应用

来源 :江苏大学 | 被引量 : 0次 | 上传用户:baino1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据与人工智能技术的应用普及,海量多源异构数据急剧增加,特别是非结构化数据的增加,传统大数据平台在处理多源异构数据时,面临数据采集处理能力不足、数据结构难以统一,数据运维困难等挑战,为洞察数据的价值带来了层层阻碍。其原因之一是数据来自于各行各业的系统,每个系统的数据建设的标准各不相同,因此数据源是不同的,所以需要对数据源进行动态扩展管理,这需要对元数据进行组织和管理。异构数据源汇聚至统一平台,同时保证大数据安全使用,需要对数据进行统一标准管理,并对数据访问控制进行管理,如数据宿主管理。在大数据管理中,还需要考虑如下应用问题:针对应用生命周期的数据冷热调度管理、解决数据存储安全和灾害的数据备份以及副本管理、针对海量数据存储和调度优化的数据分区分片的存储策略等。上述这些问题均需要借助元数据实现有效管理和相关策略设计,为此,本文将主要讨论服务于大数据的元数据方法和应用。本文针对大数据中数据管理问题进行研究,采用RDB的元数据扩展方法,对Big Data中数据表、数据视图、数据访问、数据组织等进行动态定义和管理,解决数据源扩展、数据异构、数据重组、数据迁移中遇到的问题。本文主要工作分为以下两个部分:1、提出了基于数据版本的数据表元数据结构,探索能够解决数据抽取以及数据更新过程中原始数据管理的问题;为了能够动态扩展数据源以及解析异构数据,设计了一种含有数据映射的数据源元数据结构;由于大数据中数据形式各种各样,设计了一种宿主授权的动态元数据结构,能够有效的解决多种形式数据组织的定义问题;提出了一种含有时间戳的数据侦听元数据结构,解决了大数据中数据加载和迁移时效的问题。2、研究了一种基于时间块增量更新方法,能够对元数据进行增量抽取,本文开发了元数据管理demo系统,对本论文中提出的研究进行验证。
其他文献
随着人口增长、科技的进步,能源的需求量快速递增,同时因化石燃料的大量使用也引起了一系列的环境问题,如,大气、水体、土壤污染和温室效应等,若不能从源头解决这一系列问题,则在未来无法保证人类的命运和生态环境的可持续性发展。为了更好解决因化石燃料燃烧及石油化工生产而引起的环境污染问题,科学家致力于寻找清洁、高效和稳定的化石燃料替代能源。氢气因燃烧热高、原料充分、反应终产物清洁、零碳排放等优势,引起了科研
类风湿疾病是一种对身体危害极大的慢性全身性疾病,患者没有及时就医进行治疗,致残率将会达到70%。大量的研究证实,各种类风湿疾病越早介入治疗,恢复的效果越好。而目前类风湿疾病患者大多是发病后才进行就医,因此医院对类风湿疾病患者基本是以治疗为主,尚缺乏对类风湿疾病患者发病前身体指标异常的监控机制。而对于类风湿疾病而言,医生在早期及时进行疾病干预才是最有效的手段。因此本文利用机器学习技术,并结合现有医疗
当今社会和工业的快速发展导致传统化石能源快速消耗,并由此引起了严重的环境污染和能源紧缺问题,这迫使我们必须尽快开发出新型绿色能源以满足未来的能源需求,并构建一个更舒适的居住环境。氢能源具有高温溶解性能强、能量密度高、燃烧性能好、燃烧过程中完全不产生有害物质等优点,被认为是未来最理想的能源。在氢气的生产方法中,电解水工艺因为操作简单、氢气纯度高,是最有潜力的制备方法。但目前电解水析氢反应(HER)中
近年来,永磁同步电机凭借其高效率,低温升以及高功率因素等优点,被广泛应用于各行各业中。与此同时,它的安全性和可靠性也成了人们选择电机的首要考虑因素。退磁故障是永磁同步电机故障中的一种,轻则影响电机运行效率,重则导致电机损毁,造成令人难以接受的后果。若能在永磁同步电机运行初期,及时诊断出退磁故障并加以维修,就能预防退磁程度进一步扩大,从而减少维修费用,保障人身安全。因此,诊断永磁同步电机的退磁故障具
当前,全球自动驾驶汽车的发展浪潮正大力助推汽车高级辅助驾驶系统与汽车主动安全系统的研发。准确地感知车辆所需的多种信息对车辆系统的稳定运行具有重要意义。现有的信息感知方法大多针对某一类信息,且/或往往在特定的简单场景(如:水平路面、车辆结构参数保持不变等)下进行。但是,不同种类的车辆系统信息之间往往存在不同程度的耦合关系,对某类信息单独感知的做法常常伴随着鲁棒性和适用性问题。此外,由于地形限制或设计
无线传感器网络(Wireless Sensor Networks,WSNs)作为物联网(Internet of Things,Io T)重要的“神经末梢”,目前已成为新一代高效信息获取和处理技术的代表,其通过随机部署在网络内部的传感器节点来感知周围环境,从而完成应用中的监测任务。随着WSNs在不同领域中大显身手,其节点储存能力弱、能量效率低等缺陷也逐渐凸显。而分簇路由协议作为一种高效可扩展的路由协
锍盐类化合物由于其空间结构和价态变化是有机合成中重要的反应物和中间体,且其带有正电荷,可以很容易的发生单电子还原,从而在天然产物和药物分子的合成中起到重要作用。光诱导碳-硫键断裂产生的自由基中间体可用于构建各种化学键。本论文主要是将烯基锍盐、芳基锍盐与光催化结合,使其作为自由基受体或者自由基供体实现C-C键的形成。包括的工作如下:(1)可见光催化的烯基锍盐作为迈克尔受体的乙烯基化反应。在本章中,我
新能源技术正在逐渐成为各个国家的战略发展目标,太阳能则是其中最重要的能源技术之一。目前光电转化效率最高的为单晶硅太阳能电池,单晶硅电池在生产过程中容易产生破裂、黑斑、划痕、断栅等缺陷,严重影响光电转换效率。通常对单晶硅电池板的缺陷检测采用电致发光(Electroluminescent,EL)成像原理。传统的基于EL图像的单晶硅电池板缺陷检测通常采用机器视觉检测技术,由于其准确率提升瓶颈较大,已经不
二硫化钼(MoS2)是类石墨烯层状材料,由于具有高载流子迁移率、无悬空键、可调控的宽带隙及摩擦系数低等优点,在电子器件领域具有广泛应用前景,但随着电子器件的微小化,MoS2薄膜的比表面积增大,表面效应的影响增强,因此对表面效应的微观适用规律的探索显得格外重要。本文使用化学气相沉积法(CVD)制备生长温度为650℃,沉积时间为20 min、1 h、1.5 h、2 h的MoS2薄膜,并对样品进行结构、
白云石粉(Dolomite Powder)是由白云岩破碎后产生的石屑粉末,在建筑、医疗、化工和农业等领域有着广泛的应用。白云石粉是一种经济实用的矿物掺合料,不仅能减少水泥用量降低混凝土生产成本,还能补偿混凝土收缩和改善混凝土孔隙,可以通过将白云石粉废屑资源化解决废弃石屑污染环境的问题。本文受国家自然基金项目(51778272)资助,结合现有的理论知识和前人研究内容,以白云石粉作为研究对象,探究其在