论文部分内容阅读
膜计算是自然计算的一个新分支,模型的构建强调在细胞功能原理中寻求灵感,其模型通常称为P系统。P系统主要由膜结构、对象以及进化规则三部分构成,具有与图灵机等价的计算能力。频繁项集挖掘是数据挖掘领域中一个非常重要的任务,挖掘数据中共同频繁出现的有趣项集组合,进一步发现频繁项集之间的关联,在各种推荐和预测模型中应用广泛。如今在“大数据时代”,海量数据非常容易获取,但海量数据的存储,计算能力不足等问题给频繁项集挖掘任务带来巨大的挑战,因此需要结合新的计算模型,融入新的改进方法。将P系统应用于数据挖掘,既是P系统应用领域的拓展,也为数据挖掘技术发展提供了新思路和新方法。本文首先介绍了研究的背景和意义,对涉及到的膜计算、频繁项集挖掘的研究现状和发展趋势做了综述。详细介绍了组织P系统结构定义,频繁项集挖掘含义及算法,然后对文章的结构和创新点进行了概述。提出新型膜计算模型并与改进的频繁项集挖掘算法结合,最后应用到两个实际应用中。主要研究内容如下:1.基于组织P系统和细胞分裂分化功能提出新型裂化自适应组织P系统(DATP),利用寄存器原理验证系统的计算能力,自适应的分裂和分化规则可以减少资源使用。在生物酶和通道反馈机制基础上基于DATP衍生出特定酶促裂化自适应组织P系统(EDATP)和反馈裂化自适应组织P系统(FDATP),设计系统运行机制和进化规则,优化系统结构。2.提出基于EDATP系统的改进Eclat算法,直接膜算法ETP-EL。利用包含性质和膜系统结构提出改进的剪枝策略,减少在频繁项集挖掘过程中的判断次数和系统内使用对象的数量。设计算法规则,分析算法流程,利用P系统的并行性和大规模性,极大地降低了算法时间复杂度并通过实例实验验证了系统有效性,最后利用四个数据集分析了算法阈值选取的重要性及剪枝策略的有效性。3.改进了VTK算法,提出基于FDATP系统的PDT-VTK算法,设计规则和系统结构实现算法在膜中的运行。利用差异集数据结构改进算法并设计支持度求解方式,减少算法在密集数据频繁项集挖掘过程中的内存占用并提高时间效率,设计格式转换条件使算法在不同的情况下自动选择合适的数据形式,利用UCI、PUMSB和真实数据集验证了改进算法的有效性。4.将提出的ETP-EL算法应用到微博用户推荐应用中,在频繁项集基础上结合关联规则设计了微博用户推荐系统,根据用户的微博关注ID信息向其推荐兴趣相关用户。将PDTVTK算法应用到超市货架布局应用中,在对超市购物篮原始信息进行处理分类之后,挖掘商品类之间的相关性,给出合理的超市货架布局推荐。