基于嵌套关系演算的数据起源研究与实现

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:mrchangmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据云存储概念的诞生以及因特网的普及导致的信息流加速,各种行业正在形成庞大的、复杂的、异构的数据环境。在这些庞杂的数据环境中,有一些公共数据库在生物学,天文学等专业领域占有重要地位,由于这些数据采集和加工时并没有统一的标准,造成了数据质量的参差不齐,因此分析及还原数据产生和变迁的过程,对判断数据的质量以及修正数据中的错误显得尤为重要,数据起源正是针对这一问题展开研究的。本文的研究工作主要包括如下几个方面:1、研究了目前关系数据库中数据起源的相关概念以及技术方法,并重点针对包含聚合函数查询的数据起源展开研究。2、针对关系数据库中的数据起源的查询等价以及聚合函数问题,对嵌套关系演算表达式进行扩展,将聚合函数作为基本算子,扩展后的嵌套关系演算能够与关系代数表达式进行转换,为实现具体的起源追踪系统打下了基础。3、基于嵌套关系演算建立起源追踪模型,并引入标注模式,通过分析查询表达式输出的标注信息得出查询表达式的行为,从而最后得到输出结果与输入的依赖关系。4、研究了如何构建实际有效的起源追踪系统,并进行了具体实现。最后,为了提高起源追踪系统的查询与存储效率,本文还对存储模型进行了改进,实验表明改进后的存储模型较原始存储模型性能有一定的提升。
其他文献
现代服务业是指在工业化比较发达的阶段产生的、主要依托信息技术和现代管理理念发展起来的、信息和知识相对密集的服务业。服务管理平台是现代服务业的基础支撑平台。传统的
计算需求日益增多的今天,人们普遍采用GPU(Graphics Processing Unit)作为运算加速设备,现在利用通用显示核心(General-Purpose GPU,GPGPU)计算技术已经成为任何海量数据的必
随着通信技术、嵌入式计算技术和微电子技术的飞速发展和日益成熟,传感器网络引起了人们的极大关注,这种网络系统可以被广泛地应用于国防军事、环境监测、医疗卫生、智能家居
供水系统是城市重要的基础设施,保障着社会经济稳定发展和人民生活安定。随着城市规模的不断扩大和人口的不断增多,人们对供水安全性、可靠性和经济性都提出了更高的要求。供水
随着经济全球化和信息技术的飞速发展,面向服务的思维方式解决了企业信息系统对于快速响应需求与环境变化、提高系统可重用性、信息资源共享和系统间互操作水平的要求的一系列
模块规划是提高软件产品族生产效率和降低软件成本的关键技术,合理规划软件产品族模块是技术研究的重点。本文在分析软件产品族和模块规划发展现状的基础上,基于需求向量运用
中文分词技术主要包含以下三个研究方向:理解分词,机械分词以及统计分词。基于理解的分词方法研究尚未成熟,所以,绝大部分中文分词系统是应用机械统计相结合的方法。在目前主
随着计算机技术特别是多媒体技术的迅速发展,图像处理技术开始广泛应用于社会的各个行业,包括炉膛火焰图像处理领域。监控摄像机输出的视频信号能转化为计算机可以处理的数字
由于系统体系和呈现行为这两种概念及其理论和应用促进了大型软件系统和互联网应用的发展,所以在国际上得到计算机软件领域的普遍重视。随着技术的进步和各领域对系统要求的不
无线网络中,在一个节点向多个节点传递同样的数据包时,往往采用多播(Multicasting)的方式逐一将数据包传递给接收节点。由于无线链路的可靠性具有时变的特性,在一个节点发送