论文部分内容阅读
数据问题的研究常常涉及数据之间的联系,于是出现了数据联系的描述问题。这里的数据联系是指数据类之间通过公共数据产生的相互关系,不妨称为数据关联。数据关联的问题源于与数据处理相关的理论和应用研究,更与实际中的数据关联现象具有联系。现实生活中,学生关联家乡人民和其他同学,间谍关联敌我双方,新婚夫妇关联双方家庭,通过这些实例可以发现很多数据与数据之间都是通过公共数据产生联系。本文通过引入相关集的概念,对一个数据集层层粒化后,进行了相关集之间数据关联的研究。粒计算处理问题的核心思想之一就是,把一个复杂的问题分解成若干小的集合,再针对每一个小集合进行划分,粒化形成粒化树的结构。本文为了描述数据关联问题,对数据集按层次进行了粒化,指定了每一粒的相关集,产生了与相关集类关联的分层粒化结构,并称为粒化树,进而以同一数据集上两棵粒化树为结构支撑,完成了数据关联的定义,展示了相关集之间数据关联的数值表示形式。最后通过实际例子探究了数据关联的相关性质,完成的工作如下:(1)为了研究实际中数据关联的问题,对现实中的各类数据予以整体表示,使数据集划分、数据的相关集、和关联元素共同组成了关联数据结构,为描述数据关联问题做了结构化的准备。(2)通过对一个数据集不同属性的划分和粒化,得到了关于一个数据集的两颗不同的粒化树,对粒化树中的每一粒指定了特定的相关集。由相关集构成的数据集,研究粒化树相关集之间数据关联的问题。(3)将不同的划分与其相关集类组合在一起,形成由粒构成并涉及相关集类的数学结构,描述了相关集类之间数据关联的定义。(4)为了描述数据关联的性质,将粒化树中每一粒层以数值化的形式表示;通过针对不同粒度层次之间数值的变化,对相关集之间的数据关联进行判定。不同粒层之间的数据关联又引出数据等同的概念,同一粒中两个不同的数据关联了两颗粒化树中不同粒的相关集,我们可以称这两个数据的关联是数据等同。(5)通过现实中的例子,构建了同一数据集上的两颗粒化树,使得具体的问题通过数学方法来进行描述。通过相关集的粒化树结构,深入讨论了不同粒层之间关联的紧密程度,建立了具体数据关联问题的数学模型,为实际问题的算法模拟和程序编制提供了支撑,是数据信息自动管理和网络查询的基础。