论文部分内容阅读
属性约简和知识抽取是数据挖据及知识发现的重要手段,变精度粗糙集理论为其提供了有效工具。相比属性约简,通过完备约简抽取知识构建的知识系统,能更全面地揭示隐藏在信息系统中的有价值信息。本文在多个国家自然基金项目资助下致力于研究完备约简与知识抽取理论、方法以及在脑认知中的应用。首先通过变精度粗糙集模型的研究完备约简与知识抽取的基本理论;然后结合所研究的理论,给出完备约简算法、知识结构构造算法以及构造可视化地展现知识空间结构;最后依据完备约简与知识抽取理论和方法,对脑认知中脑功能连接通路进行研究。这项研究不仅为脑认知提供了有效的研究方法,而且对于人工智能技术为导向的类脑研究具有重要的理论价值,全文具体从以下几个方面展开:本文利用变精度粗糙集模型提出了一个完备约简与知识抽取理论,定义了完备约简集合、多知识和系统指标,给出了分布表、谱系二叉树、知识空间结构三个新概念,通约简内部、知识内部以及二者之间关系的分析,指出知识空间具有双层结构的特征,并利用Hasse图可视化地展示知识空间双层结构。以完备约简与知识抽取理论为基础,利用所提出的谱系二叉树作为获取完备约简的策略,给出了一个获得完备约简集合的算法。在保证获得完备约简集合的基础上,引入了四个重要的加速搜索策略:分布表的缩减、属性序的动态更新、启发式二值分类以及谱系二叉树的剪枝,这些策略加快了算法收敛速度。在理论上给出了算法完备性的证明,实验结果表明所提出的算法能够得到完备约简集合。通过研究知识抽取流程,提出了多知识抽取框架,完整地实现由数据转化成约简,再由约简到知识的过程。针对变精度粗糙集模型只能处理离散数据特点,在预处理部分提出了一种并行化的基于信息熵的连续属性离散化算法。在经过完备约简集合形成多知识系统后,给出了利用多知识系统确实知识决策值的方法,提出了一个知识结构构造算法,从而获得构建知识空间双层结构的信息。脑认知研究面临的挑战之一是如何能更多地从功能性磁共振成像数据中抽取有用知识,以多知识抽取框架为基础开发的多抽取系统为其提供了一种新的解决方案。通过多知识系统的完备约简算法获得功能性磁共振成像数据的所有约简,然后根据完备约简集合获得相应的多知识系统,再利用知识结构构造算法获得知识空间双层结构信息。通过多知识抽取系统的应用,形成脑认知的整体集成技术,挖掘隐含的脑认知知识,为脑认知的研究提供有效的研究方法和工具。