论文部分内容阅读
膜计算是通过模拟细胞的结构和功能而构建的一种新型计算方法,其模型通常被称为膜系统或者P系统。膜计算作为自然计算中最年轻的分支,由于生物理论和技术的融合,在计算领域得以迅速发展。P系统主要由膜结构、对象以及进化规则三部分构成。由于生命体中细胞器和细胞膜运行的相互独立性,P系统按照极大并行模式运行,其计算能力等价于图灵机,甚至有超越其局限的可能性。由于互联网与传统行业的相互结合,各种形式的数据不断涌入,随之而来的海量数据处理问题成为大数据背景下的巨大挑战。大数据的特征是数量巨大、结构复杂、类型众多,因此,需要结合新的计算方法,融入新的计算模型,提升数据的有效性和可阅读性,新方法和新模型研究成为数据挖掘领域的重要研究课题。聚类分析作为处理数据并从数据中提取知识的一种有效手段,是数据挖掘领域内的一项重要内容,其重要性在模式识别、图像处理等领域均得到了广泛认可。本文的研究内容如下:1.基于结构及运算扩展的自适应扩展P系统设计及其计算能力、计算效率分析从结构以及运算两个角度出发,扩展了传统的P系统,提出了四种自适应扩展P系统:带有膜分裂和膜溶解规则的脉冲神经P系统、链式P系统、带有协同规则的类组织P系统以及带有多促进剂/抑制剂的时间无关类细胞P系统。在带有膜分裂和膜溶解规则的脉冲神经P系统中,通过引入膜溶解规则,实现冗余细胞移除的功能,该规则可以减少资源的使用。在链式P系统中,系统结构、对象以及规则都是链式的。在带有协同规则的类组织P系统中,每个膜内的规则划分为不同的部分,每个部分分配一个编号,当系统内的规则执行的时候,只能有一个部分是处于激活状态的,也就是说,只有这个部分当中的规则有被执行的机会。这样,相同编号部分内的规则可以协同完成一个功能。在带有多促进剂/抑制剂的时间无关类细胞P系统中,每个规则可以带有多个促进剂/抑制剂,其中任意一促进剂/抑制剂可实现促进/抑制功能。同时,通过模拟注册机、矩阵文法以及Lindenmayer系统等证明了扩展P系统的计算能力,通过求解计算难问题分析了扩展P系统的计算效率。2.P系统面向对象描述、建模及可复用构件设计将P系统当中涉及的概念归纳为六个类:P系统对象、膜、规则、类细胞P系统、类组织P系统和类神经P系统,对其进行了面向对象的描述;设计了一种可行的P系统的计算机存储结构,并设计了 P系统的面向对象的静态模型以及动态模型,对P系统的静态描述以及规则的动态实现进行了归纳总结。同时,建立P系统的可复用构件,提取构建P系统的通用基本构件以及领域共同构件,构建含有最大粒度的构件集合并将以上技术以多种插件和按钮的图形化方式嵌入P系统实现平台。3.多种基于扩展P系统的改进聚类分析算法设计与应用将扩展P系统与聚类分析算法相结合,构造了多种基于直接膜算法的改进聚类分析算法,包括:基于带有多促进剂/抑制剂的时间无关类细胞P系统的DBSCAN算法、基于链式P系统的ROCK算法、基于链式P系统的图聚类算法以及基于带有多促进剂/抑制剂的时间无关类细胞P系统的集成聚类算法。设计算法规则,分析算法流程、算法复杂度,并将算法用于数据集的聚类分析,验证算法的可用性和有效性。实验表明,基于直接膜算法的改进聚类分析算法在效率和精确度上均有提升。同时,构造基于带有多促进剂/抑制剂的时间无关类细胞P系统的PAM算法,用该算法求解45个真实新闻标题构成的数据集的聚类分析问题,验证了算法的可用性和有效性。作为一种新型的计算方法,扩展P系统的提出及其系统分析一直都是膜计算领域的重要研究内容。同时,膜计算在多个领域得到了初步应用,但是针对聚类分析问题的应用还较少。因此,本文所提出的扩展P系统及其在聚类分析中的研究与应用,是具有重要科学意义和实践价值的研究问题。