基于动态组织膜系统的谱聚类集成算法研究与应用

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:daolong163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息时代到来,数据量激增,数据复杂度高,如何从这些数据中挖掘有用信息正成为数据挖掘的一个重要研究方向。聚类研究是数据挖掘的一个主要方法,是一种有效分析数据、挖掘有效信息的方式。传统的聚类算法如k均值算法、k中心点算法等在处理日渐复杂的数据时显得力不从心。谱聚类是一种建立在图论基础上的新型聚类算法,近年来谱聚类算法因其具有坚实的理论基础和优异的聚类效果吸引了越来越多的学者对其进行研究。但是只采用一种聚类算法通常无法处理各类异构数据集和计算过程中面对的问题。聚类集成的思路是通过一定的方式整合多个学习器产生的基聚类以产生新的聚类结果,因其结合了学习器的差异性和精确性,所以集成算法泛化能力强,生成聚类结果更优。膜计算是仿照生物细胞膜工作机制提出的一种高效、新颖的计算模型,它涉及计算科学与生命科学两大领域,是一门综合学科。本文主要对谱聚类算法、谱聚类集成算法以及膜计算进行了研究,具体研究内容如下:首先,介绍了本文涉及到的膜计算、谱聚类算法、聚类集成算法的研究现状及国内外研究趋势。细胞型膜系统、组织型膜系统和神经型膜系统三种膜计算模型的结构、规则;图划分准则、谱聚类概述;聚类集成算法原理、学习器合并策略以及各自研究应用和本文的创新的与难点。其次,本文提出两种新型组织型膜系统—动态组织膜系统(Dynamic Tissue-like Membrane System,简称DTP系统)和混合型动态组织膜系统(Hybrid Dynamic Tissue-like Membrane System,简称HDTP系统)。前者可以根据输入数据调用膜内规则动态调整结构,实现自动聚类;后者在DTP系统基础上将组织型膜系统与细胞型膜系统结合,使之成为适合聚类集成算法的结构。同时利用寄存器证明了DTP系统和HDTP系统的图灵可计算性。然后,提出两种基于膜系统的聚类算法。第三章提出基于动态组织膜系统的改进谱聚类算法(Improved Spectral Clustering Algorithm,简称为ISC算法),将基本谱聚类算法中用到的K-means算法初始点的选取方法进行了优化,使K-means算法不易受初始聚类中心和离群点的影响提高算法准确性,并将改进算法与膜系统结合,用实验证明改进算法在聚类准确性和处理球面数据集方面的优越性。第四章以ISC算法为学习器,利用Bagging技术和选择性集成策略设计了基于Bagging技术的改进谱聚类选择性聚类集成算法(Improved Spectral Clustering Selective Clustering Ensemble Algorithm Based on Bagging Technology,简称为ISCBE算法),再将此算法与HDTP系统结合,利用其并行计算优势提高算法有效性。本章将HDTP-ISCBE算法与DTP-ISC算法、谱聚类算法及K-means算法进行比较,在UCI数据集上显示出较好的聚类效果。最后,本文将提出的HDTP-ISCBE算法应用到微博用户和小红书用户细分研究中,用网络爬虫软件分别爬取两个平台用户数据,对数据进行清洗、编码、特征选择等一系列操作后利用HDTP-ISCBE算法对数据进行聚类,以聚类效果衡量算法效率,从实际意义方面分析细分后用户类型的特征,以此为依据为企业针对不同类型微博用户设计营销方案提出意见与建议。
其他文献
发电企业是资金密集型企业,资产负债率较高,流动资产中应收账款比重较大。在当前电力供需已经由不足转为相对过剩和新电改推进的背景下,探讨加强应收账款管理,并通过金融手段
债务问题作为"世界财政疑难问题",正日益受到各国政府和国内外理论界、实务界的高度关注。近年来,地方政府性债务增长较为迅速,积累了一定的风险,从对经济社会的影响上看,地
通过选取2003-2016年有关XBRL 12年的核心期刊,进行计量的同时将其按宏观、微观进行分类。将宏观类文献按价值优势、应用风险及对策、应用现状及发展建议、文献研究及未来研
美刊《反思马克思主义》杂志2002年夏季号刊登了大卫·M.科茨题为《全球化与新自由主义》的文章,认为全球化趋势和新自由主义的兴起之间有很大的相关性。全球化所表征的跨国
<正> 艺术瓷是人类相互交往、美化生活环境和陶冶性情的一种装饰品。它较之日用瓷是审美功能高于实用功能,具有题材广泛、手法多样等特点。艺术瓷作为人们所喜爱的一种装饰品
<正>党的十八大报告明确指出,要"把立德树人作为教育的根本任务,培养德智体美全面发展的社会主义建设者和接班人",这既是对"育人为本、德育为先"的基本教育理念的进一步深入
<正>所谓批判质疑思维,是指对所学内容的性质、价值、真实性和精确性等进行个人判断和合理决策的思维方式。在高中语文阅读教学中,特别是对一些经典名篇的学习,需要运用批判
贫困地区的脱贫在全面建成小康社会工作中占据了极其重要的地位,改革开放以来我国政府出台了一系列扶贫政策,并根据社会发展和实际情况不断做出调整。自习总书记在湖南实地考察时明确提出了“精准扶贫”重要思想以来,投向贫困地区的各类扶贫资金也随之增加,脱贫工作取得了较大的成效。所谓的财政扶贫资金,是指国家通过现金、实物等方式下拨给贫困地区,用以改善贫困地区人口的基本生产生活条件,在提升贫困人口生活质量的同时,
汾河是黄河的第二大支流,是山西人民的母亲河。文章论述了治汾措施的理论依据以及采取水土保持、植树造林等措施,改善了汾河生态环境,保护了省城水源地,为农民增收精准脱贫,
目标跟踪长期以来是计算机视觉(Computer Vision,CV)领域中的热点研究分支。在仅提供目标初始帧信息的情况下,能够继续跟踪目标后续帧的运动路径。作为多学科交融的研究方向,在导弹制导、智能化监控、无人机追踪及医学影像分析等多个领域中有所应用。从早期均值漂移、粒子滤波和光流法等生成式模型跟踪算法到现在主流的相关滤波和深度学习等判别式模型跟踪算法研究的不断突破,使得现有目标跟踪技术在算法性能