面向异构信息网的多维分析技术研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:esinstra
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和信息的爆炸式增长,数据的表示手段和表现形式越来越丰富,数据对象之间的关联关系也越来越复杂。信息网络数据模型较传统的关系数据模型在数据信息语义表达能力与数据对象间关联关系表示能力上更具优势,被广泛应用到具有复杂关联关系和内部拓扑结构的数据建模中。信息网络根据实体类型的数量和关系类型的数量被分为两类:同构信息网络和异构信息网络。相比于同构信息网络,异构信息网络能够更加自然和准确地表达和存储现实世界中实体以及实体之间的关联信息,包含更加丰富的语义。对异构信息网络进行多维分析,能够挖掘其中潜在的有价值的知识,具有重要的研究意义和价值。目前对于信息网络多维分析的研究,偏向于同构信息网络,不能直接用于异构信息网络。本文针对异构信息网络的多维分析问题展开相关研究,主要工作如下。提出了一种基于图正则表达式的异构信息网查询语言。首先,提出了图匹配模式的概念,可用来准确描述用户的查询语义。然后,设计了一种新颖的图正则表达式来描述图匹配模式,其中,路径正则表达式(Path regular Expression,PRE)描述线性图匹配模式与环形图匹配模式,图正则表达式(Graph Regular Expression,GRE)描述更复杂也更普遍的星型图匹配模式和混合型图匹配模式。图正则表达式既能提供良好的查询语义表达能力,又有很好的查询处理和查询优化性能。最后,提出了基于图正则表达式的异构信息网查询语言(Regular Expression Graph Query Language,ReQL),支持对异构信息网络的实体属性、子图结构和信息聚合的查询分析。提出了基于图正则表达式的三层结构图立方体模型。首先,定义了两种异构信息网多维分析的维度,分别为属性维和结构维,并分别介绍了二者的维度层次结构。其中,属性维用于从顶点或边的角度查看数据,结构维用于从拓扑结构角度查看数据。其次,基于不同的聚合方式与所表达的内容,定义了内容度量、数值度量和图度量这三种异构信息网络度量方式。然后,基于维度与度量,提出了一个三层的异构信息网络图立方体模型,以支持对异构信息网络全方位多层次的数据分析,最外层包含初始图和四个子立方体(线性结构图立方体、环形结构图立方体、星型结构图立方体、混合型结构图立方体),中间层是结构维图立方体,最内层是属性维图立方体。最后,分别给出了子立方体内的OLAP操作和子立方体间的OLAP操作,重新定义了OLAP基础操作上卷和下钻的操作语义,用以支持对图立方体的多维查询。给出了ReQL的查询处理与优化。首先,设计并实现了ReQL解析器,对ReQL依次进行词法分析、语法分析和语义分析,识别ReQL表达的查询语义。然后,给出了ReQL查询处理过程,并重点介绍了PRE/GRE的查询处理过程,提出了两种PRE/GRE查询处理方式,Navigation查询和HashJoin查询。接着,提出了两种PRE/GRE查询优化技术,包括索引技术与基于代价模型的查询优化技术。最后,通过实验验证了基于代价模型的查询优化技术的可行性和有效性。设计并实现了异构信息网络多维分析系统。首先,介绍了系统的架构设计。其次,给出了数据存储方案。然后,介绍了系统采用的物化策略。接下来,给出了系统OLAP操作的实现,包括OLAP操作的实现框架、上卷操作与下钻操作的实现。最后,通过实验验证了系统多维分析的有效性并进行了OLAP操作实现方法的对比实验。
其他文献
乡村纪录片,是以乡村题材为核心,以农业、农村和农民为主要内容的纪实影像作品,也被称为乡村题材纪录片或涉农纪录片。它在呈现乡村自然景观、展现乡民精神风貌、留存乡土记忆等方面具有无可替代的价值和意义。在乡村振兴战略背景下,乡村纪录片更是承载了见证乡村变革、讲述乡村振兴故事、传播乡村文化的重要功能。乡村纪录片《樱桃红了》以纪实影像讲述辽宁大连地区的果农范大本一家通过樱桃种植摆脱贫困、转变家庭命运的故事,
学位
成像跟踪装置是精确制导武器的核心部件,可以实现目标追踪和精确制导等多种复杂功能。姿态测量是成像跟踪装置实现多样化功能的关键技术,目前多数姿态测量系统体积较大,姿态
随着世界能源问题日益严峻,节能减排已成为各国重点关注的问题,据资料显示,我国建筑能耗占全国能耗量的三分之一,建筑节能方面潜力巨大。我国城市化正处于高速发展时期,大量人口涌入城市,加速了高层住宅的建设,新建高层住宅占到了新建建筑的40%以上,在能源问题紧张的今天,高层住宅节能设计就显得尤为重要。现有的研究成果和相关节能标准虽然对住宅节能设计有帮助,但在高层住宅节能中的适用性方面仍然存在诸多弊端。本文
近年来随着化石资源逐渐枯竭和能源消耗增加,通过可再生含碳生物质资源合成燃料或高附加值的化学品成为研究热点。其中,2,5-呋喃二甲醛(DFF)在药物、抗真菌剂、大环配体和高
当前社会的能源短缺和环境污染问题日益突出,促使了新能源开发与利用技术的快速发展。超级电容器和锂离子电池等储能器件领域的研究受到了广泛的关注。其中储能器件的电极材料是决定其性能的关键因素。石墨烯由于具有高导电性,高比表面积以及优异的电化学稳定性等特点,在储能器件电极材料方面展现出广阔的应用前景。然而如果单一的石墨烯材料作为储能器件的电极材料时,会出现储能容量较低问题。相比之下,Cu(OH)_2和硅材
随着信息物理系统(Cyber-Physical System)及其相关技术在实际社会生产生活中的广泛应用,CPS安全问题受到社会各界越来越密切的关注。大规模的CPS应用场景,导致了系统不确定性的激增,系统的不确定性预示着CPS的安全不仅仅与系统设计时的规范有关,更需要考虑到不确定发生的稀有事件(Rare Events)对CPS安全性的影响。CPS在安全攸关的领域的应用,如航空航天、武器装备、医疗设
从2004年单原子层石墨烯的发现开始,二维材料的相关研究就一直是凝聚态物理的热点方向之一。近年来,不同二维材料堆叠构成的层状异质结体系受到极大关注,它们不仅能实现更丰
配体辅助再沉淀法(LARP)是一种便捷和廉价的合成方法,能够制备具有优异光电性能的钙钛矿纳米片。然而,这种方法仍存在纯化和钝化步骤敏感的问题。在本研究工作中,我们提出了
近年来,关于神经网络的同步性研究已经有了许多有价值的成果,但这些研究基本上都是建立在传统的实值神经网络(RVNNs)模型上。复值神经网络(CVNNs)比实值神经网络更具有一般性和复杂性。本文围绕复值神经网络,利用混杂脉冲控制方法、李雅普诺夫泛函方法、平均脉冲间隔(AII)和平均脉冲增益(AIG)理论研究了复值神经网络的主从同步。全文分为四章,主要内容如下:第一章概述了复值神经网络同步性研究的现状、
目的:研究严重发热伴血小板减少综合征病毒对THP-1细胞TLRs表达的影响。方法:1.以SFTSV JS14株为病毒株,用Vero细胞接种培养,每隔24 h收集细胞培养上清并经定量PCR检测SFTSV