【摘 要】
:
传统的聚类算法大多直接在特征空间中进行分析计算,对于高维数据无法实现直观有效的聚类结果图形可视化。基于距离相似性的聚类算法易于理解,计算效率高,但无法有效处理空间
论文部分内容阅读
传统的聚类算法大多直接在特征空间中进行分析计算,对于高维数据无法实现直观有效的聚类结果图形可视化。基于距离相似性的聚类算法易于理解,计算效率高,但无法有效处理空间中非凸球分布的数据集。本文提出了一种基于图数据建模的聚类方法,将特征空间数据映射到图空间进行聚类分析,从而得到原数据的聚类结果。同时,本文提出了“邻近边界可信度”概念,并提出一种基于PageRank算法的可信度检测方法RDBPR(Reliability Detection Based on Page Rank),对聚类结果进行可信度检测。首先总结了传统聚类算法和图聚类算法的研究现状、意义及思路,为后续的研究奠定基础。其次,简要概述了图论的基础知识和相关概念,然后综述了基于特征空间的聚类算法和图聚类算法,并对软聚类和聚类结果可信度概念做了介绍,最后概述了PageRank算法的相关概念。第三,根据传统的在特征空间中的聚类算法存在的问题,结合对不同类型数据集的实验分析,提出了一种基于相似度的图数据建模方法,并对建模得到的图数据进行基于模块性度量的聚类分析,进而得到原特征空间数据的聚类结果。第四,提出了“邻近边界可信度”的概念。考虑模糊聚类算法的软聚类结果作为可信度度量的不足,结合图数据的特点,提出了一种基于PageRank算法的可信度检测方法。最后,对开源数据集进行实验仿真,并与传统聚类算法进行对比。同时本研究设计开发了一个综合实验平台,可以对导入的数据集进行相关的聚类实验分析。
其他文献
伴随着信息处理技术的飞速发展,数字信号处理器(Digital Signal Processor,DSP)凭借强大的数据处理能力、丰富的片上资源和灵活的扩展接口等优点,不仅在计算机、通信等专业领域得
随着飞机越来越复杂、以及计算机性能的不断提高,为了提高飞机的设计效率,我国航空工业系统提出了“飞机数字化工程”的设计理念,本课题组在此背景下以Rhapsody和Simulink为核心
随着棉纺企业生产规模的不断扩大,生产过程也变得日益复杂,仅仅依靠经验手工编制生产调度计划已难以应对快速多变的市场需求。因此,对计算机辅助生产调度的技术进行研究,设计并实
随着计算机性能的快速提高,计算机视觉被越来越广泛的运用到了许多场合,如遥感图像分析、文字识别、医学图像处理、多媒体技术和图像数据库等方面。计算机视觉中的许多问题,
多属性决策(又称有限方案多目标决策)是现代运筹学和管理科学的重要分支,其理论与方法在经济、工程、管理和军事等诸多领域都有着广泛的应用。当人类面临着越来越多的复杂、
快速发展的半导体集成电路成为了现代工业升级进步的强力助推器,而依赖高精的集成电路的工业设备中,静电放电引发的火花容易造成设备故障。静电火花能辐射出高频电磁波,瞬时
煤矿的工作环境比较恶劣,极易发生漏电故障,漏电事故处理不及时会给煤矿生产带来严重的安全隐患,因此需要及时、快速、准确的报告漏电故障信息,以进一步采取相应措施,保证矿井的安
本文旨在研究信道公零点对现有的典型盲算法的影响,揭示几种典型算法对信道公零点的容忍度。依赖二阶统计量进行信道盲辨识的本质性缺陷是被辨识信道必须是互质的、不含公零
本课题是天津市科技创新专项资金“新一代移动通信网络覆盖关键技术研发及示范应用”的一个子课题。TD-SCDMA系统干扰主要分为系统内干扰与系统间干扰,本文仅针对系统内的干扰
注塑机是现代产品制造业中主要加工设备之一,是成型塑料制品的专用设备。近年来注塑机测控技术的飞跃发展为实现塑料制品的先进生产奠定了重要基础。随着注塑机的发展,其对测控