基于动态决策的半监督聚类集成研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:zhuchao2549
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是把数据对象或规则划分成若干个子集的过程,每个子集代表了一个簇,其目标是使得簇中的对象彼此的相似,而与其他簇中的对象尽可能的不相似,聚类分析已经广泛地应用到许多应用领域。聚类集成技术的出现提升了单一聚类算法的不足,在算法的精确度、鲁棒性、稳定性、并行化等方面有更大的优势。半监督聚类集成技术很好的利用了已有的先验知识进行聚类集成的指导,从而能够获得比聚类集成更为精确的聚类结果。近年来,随着聚类技术的不断发展,许多学者开始将群体智能优化算法引入到了聚类分析中,其根本策略是将聚类问题转化为优化问题,通过模拟自然界的某些群体智能行为然后进行启发式搜索,其最终目的是寻找到具有最优目标函数值的聚类划分。基于群体智能优化的算法有蚁群算法、粒子群算法、人工免疫算法、混合蛙跳算法、鱼群算法和蜂群算法等,它们在聚类分析领域得到了广泛的应用。本文借鉴果蝇优化算法的思想,提出一种基于群体智能的聚类分析算法,该算法更新每只果蝇的三维坐标至全局最优位置再进行随机搜索寻优,通过多次迭代以此找到最佳聚类中心,相比其他群体智能聚类算法,它的参数少,算法思想简洁易懂,实验证明本文提出的算法相比于其他对比算法有着较高精度和效率。聚类集成是集成学习的重要部分。它的目的是集成多个不同聚类算法或者单个聚类算法拥有不同的参数情况下得来多个聚类结果,从而得到更为精确的聚类结果。CHAMELEON作为一个层次聚类算法,能够发现不同形态以及大小的簇,且能够动态的决策合并这些簇。基于CHAMELEON的这些优点,本文提出了一种基于动态决策的聚类集成算法,并且给出了其无监督和半监督集成模型。其分为三个阶段,阶段一:通过相似度矩阵构造稀疏图;阶段二:划分这些图得到大量的子簇;阶段三:通过动态的合并这些子簇得到最终的聚类集成结果。实验也证明了该方法在稳定性和聚类集成结果上相比于其他已有的聚类集成算法有优势。
其他文献
随着因特网的发展,人类的社会活动开始广泛使用人工智能技术,该技术的应用发展通常需要构建不等规模的知识库来为其做后台数据支撑。而知识库的建设往往需要从海量的半结构化
本文对特征选择算法研究及其在孤立性肺结节诊断中的应用进行了研究。文章提出了一种新的基于粗集(RS)与遗传算法(GA)的特征选择算法。该方法将遗传算法(GA)与粗集(RS)思想有
随着计算机技术、通讯技术的飞速发展和个人计算机的普及,Internet作为一个全球网络,越来越融入到人们的生活、工作、学习、商务活动中。而Web在给我们带来便捷、快速、廉价
UCON被誉为下一代权限控制模型,这种模型由主体、客体、授权、义务、授权条件和证书等部分组成。UCON不仅包含传统的访问权限控制技术,也包含了数字版权管理技术,是一套能满足绝
随着全球化经济的不断发展,企业之间、企业部门之间的跨区域合作日益频繁。制造业同样也受到了前所未有的挑战,为了快速应对瞬息万变的市场需求,提高产品设计质量缩短产品设计周
以社会救助、社会保险和社会福利为基本内容的社会保障制度是现代市场经济的一个重要组成部分和标志。信息化技术发展日新月异,新技术的出现在提高人们对信息的掌握和操控能力
需求工程是软件工程初期的重要工作,其目的是得到对需求的准确清晰一致的描述以及相应的求解限制。随着需求工程的发展,基于场景的需求获取逐步得到了软件工程界的重视,出现
随着无线通信技术、嵌入式技术、计算机技术以及微电子技术等前沿技术的发展,使得能耗低、功能强的无线传感器得到快速发展。这些传感器拥有体积小,感知环境、数据采集、数据处
人脸识别作为生物特征识别技术中的典范,在人们生活中的许多领域都有着良好的应用前景。人脸识别在数十年的研究里,已经取得了很大的进步。目前在简单且固定的条件下人脸识别
无线传感器网络是由大量在空间中分布的具有通信及计算能力的传感器节点以无线多跳的方式组成的一种分布式自组织网络。它集成了传感器技术、无线通信、微机电系统、片上系统