模糊C-means聚类算法的拓展研究

来源 :云南师范大学 | 被引量 : 0次 | 上传用户:e56urty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析旨在按照特定准则,将数据集中的数据点划分为若干有意义的子集,从而挖掘出数据背后的内在结构信息。聚类分析属于无监督学习方法,在机器学习、数据挖掘和信息处理等领域得到了广泛的应用和快速的发展。在诸多聚类算法中,模糊C-Means(Fuzzy C-Means,简称FCM)是一种极具竞争力的聚类算法,它以C-Means聚类为基础,通过引入模糊隶属度将“硬”聚类推广为“软”聚类,从而将聚类问题转化为对数据点的模糊划分问题。尽管FCM受到了大量地关注和研究,但仍存在问题有待研究。例如,i)在传统FCM的目标函数中并没有顾及到数据集中可能存在的类不平衡问题,由此FCM不适合于对非平衡数据集进行聚类;ii)FCM属于无监督学习方法,没有利用可获得的部分先验(标记)信息,这不符合当前已兴起的半监督学习潮流。因此,如何将传统FCM拓展为更普适的形式是一个值得研究的问题。为了迎合更广泛的应用场景,本文对传统FCM在类不平衡情形和半监督环境下的拓展问题进行了研究。主要研究成果如下:1)提出了一种平衡化FCM聚类算法(Balanced FCM,简称BFCM算法)。针对FCM在聚类非平衡数据集时会产生“均匀效应”的缺点,本文先分析目标函数及成因,再对模糊隶属度矩阵施加正交惩罚正项以平衡“大”类与“小”类,由此得到了对非平衡数据集更有效的聚类算法(即BFCM)。2)提出了一种半监督平衡化FCM聚类算法(Semi-Supervised Balanced FCM,简称SBFCM算法)。BFCM属于无监督学习方法,针对它无法利用部分先验(标记)信息的缺点,本文在FCM的目标准则函数中引入半监督机制,从而可利用少量监督信息获得更好聚类效果。由此,BFCM将FCM拓展至半监督学习环境。
其他文献
经过多年的研究推行,生态学原理已经延伸拓展到多方面。就生态学原理在滇池水体治理中湖滨生态系统修复、水生生态系统恢复及生态农业等方面的应用进行分析,并提出几点思考。
<正>主持人:李虬(广东先锋园艺有限公司董事长)目前的花卉行业呈现出许多现象和变化。我们看到过了苗木滞销,花卉滞销,小盆栽销量增长;我们看到了市场逐步从实体走向虚拟,电
我国旅游服务贸易迅速发展始于21世纪,旅游服务贸易在我国服务贸易和国民经济中占有越来越重要的地位,成为我国综合实力和竞争力的重要组成部分。本文通过对近年来我国旅游进
IEC 61850提出了一种公共的通信标准,通过对设备的一系列规范化,使其形成一个规范的输出,实现系统的无缝连接。2009年随着数字化变电站的建设,智能变电站通信技术标准开始在
鸡在患上传染性法氏囊病后可采取多种治疗方法,选择科学治疗方法可以提高治疗效果。本文首先对鸡传染性法氏囊病的病理特征进行分析,进而通过采用试验研究方法比较三种治疗方
本项目为珠海长隆南路高陡边坡,鉴于地形变化,大量开挖路堑结构。由于岩体开挖形成的高陡边坡和珠海处于南方降雨集中区域,边坡稳定和安全成为必要的考虑因素,同时根据当前对
目的探究悬挂体位对大便失禁患者舒适度的影响。方法随机选取住院部100名神经功能缺损大便失禁老年患者,随机分为对照组半侧卧位50人,实验组悬挂体位50人,采用简化舒适状况量
通过对航次计划执行过程中存在的不力现象进行分析,指出在航次计划执行过程中容易被忽视的问题,进而提出重视人员遴选和素质培养、加强管理杜绝"随意"以及充分发挥航海人员主
T91 /P91钢是国外为提高火力发电机组的效率而研制的一种高合金耐热钢 ,它是完成超临界发电机组主蒸汽参数由 5 66℃向 5 93℃过渡的关键材料。采用受约束蠕变孔洞生长模型计
旅游业已经成为中国服务贸易中的支柱产业,无论是在国际旅游外汇收入的贡献上,还是对相关产业的促进带动上,都有着不可替代的促进作用。但是,目前我国国内对于旅游服务贸易方