论文部分内容阅读
随着数据库技术日渐成熟,互联网堆积了大量公开的信息网络数据,如何利用这些数据进行分析,并从数据中提取出对于机构决策分析有用的信息已经成为了各机构决策管理以及决策分析人员所面临的难题。联机分析处理技术被认为是解决这一难题行之有效的方法,它也成为了继联机事务处理之后,数据处理以及数据库领域研究的热点问题。经过十几年从理论研究到实用工具、相关产品以及商业应用的发展,联机分析处理已经成为了一项成熟的技术。图联机分析处理是近几年刚刚兴起的研究领域,与传统的联机分析处理技术不同,它侧重于对信息网络数据进行多角度多粒度的分析。图联机分析处理技术的优势在于可以对图数据进行快速的联机分析操作以及查询操作。然而己提出的图联机分析处理概念模型偏重于分析同质网络,对于异质网络分析能力不足,而异质网络却在现实中广泛存在,且具有极高的研究价值,采用异质网络建模可以更加完整的包含对象之间的关联信息,蕴含更加真实的知识。因此,本文结合已提出的图联机分析处理框架,基于文献数据研究多维异质网络分析框架相关技术,综合图联机分析处理技术和图挖掘技术的优点,适用于多维异质网络的分析。针对Graph OLAP的研究刚刚起步,大部分还仅仅停留在理论层面和实验阶段,缺少对实际数据的性能分析以及不同模型之间性能比较分析,本文主要研究内容包含以下几个方面:(1)多维异质网络OLAP信息模型研究。传统的Graph OLAP模型偏向于分析同质网络,对于异质网络的支持较差,因此,本文提出了适合于异质网络OLAP的信息模型;(2)新型操作以及应用场景研究:Graph OLAP的拓扑维以及信息维操作,为分析信息网络数据提供了丰富的方法,但是我们也观察到,传统的上卷、下钻、切片操作对于异质网络分析捉襟见肘,本文创新性的提出了几种适合于异质网络的新型操作,并通过实验测试了几种操作的性能表现(3)并在此基础上提出了适合于新型操作的多维异质网络OLAP数据立方体,数据立方体是OLAP进行快速多维分析的基础,本文通过提出物化策略使其可以快速响应用户的分析操作;(4)本文基于异质网络信息模型设计了信息维聚集算法以及拓扑维聚集算法,并通过了一系列的实验,测试了聚集算法的性能。