样本和特征加权的模糊聚类算法研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:zhang504752895
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是一种无监督学习方法,通过聚类技术可以从数据中获取大量知识,为此,研究人员提出了许多不同的聚类算法,其中基于目标函数的聚类是人们研究的热点,并被广泛地应用于很多领域,例如模式识别,图像分割,市场研究,数据挖掘等。然而,对于提出的一些基于目标函数的聚类算法,它们将不同样本和特征视为同等重要,从而导致聚类性能降低。为了进一步提高聚类算法的性能,研究不同样本和特征对聚类的不同贡献的模糊聚类算法具有重要的意义。通过对聚类算法的分析和分类研究,本文的主要研究内容如下:1.样本和特征加权的模糊聚类通过深入研究样本加权的模糊聚类以及特征加权的模糊聚类,在FCM聚类的目标函数及隶属度归一化的基础上,同时考虑样本和特征的重要性对聚类的影响,获得了样本和特征加权的模糊聚类模型;使用拉格朗日求解方法,从理论上导出了模糊隶属度、簇中心、样本权值和特征权值,并给出了动态调整样本和特征权值的模糊聚类算法,同时,也研究了静态调整样本和特征权值的模糊聚类算法。另外,研究了放松隶属度归一化约束的样本和特征加权的模糊聚类算法,以此解决噪声数据对聚类的影响。2.样本和特征加权的核模糊聚类为了解决复杂数据的聚类,结合核方法,并考虑隶属度归一化及放松隶属度归一化两种情况,获得了样本和特征加权的核模糊聚类模型,从理论上导出模糊隶属度、簇中心、样本权值和特征权值,并给出了相应的模糊聚类算法,包括动态调整样本和特征权值的核模糊聚类算法以及静态调整样本和特征权值的核模糊聚类算法。3.模糊聚类算法的神经网络实现为了解决复杂目标函数的聚类问题,针对模糊C均值聚类,使用Hopfield神经网络和复突触神经网络解决模糊C均值聚类的优化问题,其中Hopfield神经网络主要求解簇中心,复突触神经网络求解模糊隶属度,在此基础上,提出了模糊C均值聚类的神经网络算法。4.实验研究不同方法的性能通过选取UCI数据库中的标准数据集及人工生成数据集,实验研究样本和特征加权的模糊聚类算法和它们的核模糊聚类算法的性能,并与常用的聚类方法进行了实验比较。另外,针对iris数据集和人工生成的数据集,实验研究了模糊C均值聚类的神经网络算法。
其他文献
随着当前无线通信业务的迅速发展,可利用的频带日趋紧张,频谱资源匾乏的问题日益严重。但是研究表明,数量众多的授权频谱在大部分时间处于空闲状态,这种频谱占有状况与利用的不平
自然场景图像中嵌入的文本,是图像高层语义内容的有机组成部分。场景文本有诸多表现形式,如交通标志牌、字幕、商店名称、文本条幅、建筑物额匾等,这些信息可以为场景理解提
粒子滤波算法是一种基于蒙特卡罗方法仿真来实现递推贝叶斯估计的统计滤波方法。作为一种基于蒙特卡罗思想的非线性、非高斯系统滤波方法,粒子滤波在处理非高斯、非线性时变
当前TCP/IP体系结构的互联网存在可扩展性、安全性、移动性等诸多问题,近年来越来越多的网络研究人员投入到未来互联网的研究中。对于所取得的研究成果,研究者可以将其部署在实
信息技术发展十分迅猛,对各种产业都产生了巨大的影响。各行各业都广泛收集了海量的数据。这些数据中蕴涵大量有用的信息和知识。为从这些收集的数据中获取有用的信息和知识,
数字图像因其具有直观、生动等特点而得到广泛应用。但数字图像的另外一面,却会因数据海量给传输和存储带来压力。因此。利用其数据冗余量大这一特征,以压缩冗余数据为主要目标
随着网络负载急剧增加,给网络的结构带来了很大的压力,软件定义网络(software-defined networking,简称SDN)顺势产生。准确的测量网络的性能是保证网络高性能运行的前提。  本研
个性化推荐通过收集和分析用户显式或隐式的有效信息,从而为用户推荐所需要的个性化信息,进而能够很好地解决信息过载问题。基于矩阵分解的推荐算法是目前个性化推荐的前沿重要
无线传感器网络作为能量受限的网络,其能量十分有限,为了有效节省能量延长网络的使用寿命,在网络设计时就必须考虑降低能量消耗的方法和措施。根据已有的研究结果表明,无线传输部
不良评论正在影响着数以亿计的互联网用户,部分用户因不良评论而抑郁甚至自杀。传统的过滤不良评论的算法有两种。一是通过简单的关键词过滤技术进行评论过滤。二是在不良评论数据集上训练一个通用机器学习模型,然后使用此模型对评论进行判别。以上两种算法都没有考虑到用户个性化问题。由于不同用户具有不同的背景、拥有不同的性格,所以他们对不良评论的判别标准也是不同。无论是关键字过滤还是训练出来的通用模型都远无法满足用
学位