【摘 要】
:
不平衡数据集类别分布严重倾斜,传统的聚类算法由于以提高整体学习性能为目标,往往偏向于聚集多数类,而忽视更有价值的稀有类.本文提出一种基于迭代的特征加权聚类算法,根据
【机 构】
:
广东外语外贸大学思科信息学院,广州,510006广东外语外贸大学图书馆,广州,510006;
论文部分内容阅读
不平衡数据集类别分布严重倾斜,传统的聚类算法由于以提高整体学习性能为目标,往往偏向于聚集多数类,而忽视更有价值的稀有类.本文提出一种基于迭代的特征加权聚类算法,根据当前聚类后簇的特点以及特征重要性度量函数确定特征权值,利用所得权值进行下一轮聚类,直到权值稳定后结束迭代.在多个UCI不平衡数据集上的实验效果表明,本文算法能够较好地识别出重要特征并提高它们的权重,避免聚类算法过度偏向多数类,有效地提高了聚类性能.
其他文献
市政工程项目建设与人们的生活质量息息相关,并且还会对周围的生态环境造成影响.随着时代的进步,市政工程施工过程中面临的风险越来越多,如果不及时找出有效的应对策略,必会
在现实世界中,障碍物的存在影响了查询点到对象的可见性.可见最近邻查询返回到查询点最近的一个可见对象,是时空数据库中的一类重要应用.由于度量设备的误差和隐私保护,很多
我国社会主义经济体系中工程经济的地位越来越高,很多项目都在追求高利益的发展.对于工程的项目管理认识不够全面,对工程质量也产生了一些影响.为了工程的质量能够得到提升,
工程的品质与施工现场甲方的管理密不可分,甲方对于工程的管理模式甚至决定了整个工程的最终走向,所以提高自身的管理水平以及统筹能力是工程甲方不断的追求.鉴于此,本文就甲
在建筑建设工程中,建筑设计管理工作有着重要的作用,无论是对建筑工程的投资、建设工程的施工质量还是对于建筑工程的造价管理工作都有着重要的影响.本文就建筑设计管理工作