一种新的类属型数据模糊聚类算法

来源 :第二十三届中国数据库学术会议(NDBC2006) | 被引量 : 0次 | 上传用户:feiflymail
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是研究和处理所给定对象分类的数学方法,它将对象划分为一系列的子对象(或类),使得每一类中的数据尽量地相似,不同类尽可能有较大差异.广泛使用的聚类算法有K-Means,K-Modes等.K-Means方法是最早最简单的聚类方法,但它只能对数值属性的对象集进行聚类,无法对类属性对象聚类.其中Z.Huang提出的K-Modes算法,推广了K-Means方法,使它能够对类属型对象集进行聚类.1999年在FCM的基础上提出了模糊K-Modes算法. 大多数聚类算法需要预先设定初始聚类中心点,初始中心点的不同可能导致完全不同的结果.我们将贪婪算法的思想用到算法初始聚类中心点选择上,给出一个较为稳定,有效且时间代价小的初始化方法.实验也表明新的初始化方法比随机初始化方法更为稳定和有效. 本文提出了一个新的类属型数据聚类算法一模糊K-Patterns算法.该算法全面地考虑以往不能准确和稳定地进行聚类的原因,即避免模糊K-Modes算法在不同的初始化条件下可能带来较大差距的聚类结果,也避免了模糊K-Modes算法在处理聚类中心点时可能带来的误差和错误.新算法提出了使用贪婪初始化聚类中心,摒弃以往每次聚类循环都要求保留单个聚类中心而造成大量信息丢失的情形,将聚类中心点用集合的形式来定义,并重新定义了距离的计算公式。
其他文献
盐,是每个人都不可缺少的东西,二千二百多年以前,我们的祖先就已凿井采卤制盐.据《华阳国志》等书的记载,公元前二百五十年战国末期秦孝文王时,李冰任蜀郡守,他总 Salt is a
在工业涂料当中,阴极电泳漆与传统溶剂型涂料相比,具有经济、高效、环保等突出优点世界各工业国的汽车车身普遍采用阴极电泳漆作为防腐底漆,而且在机械、金属构件、家电五金及军
为改善夏季面漆线涂装工作高温低湿环境以提高汽车涂装质量,提出了一种新型的加湿降温改造方案.通过在空调内安装滴下浸透式湿材加湿器,大大降低了面漆线夏季空调送风温度.经
2006年10月1日至10月11日,机械工业第三设计研究院组织了一批技术人员先后到美国纽约、芝加哥、底特律、布法罗、华盛顿五城市进行了为期11天的考查活动.在美国芝加哥市,我们
CBCT的图像质量与扫描所采用的KV值、mAs大小、过滤方式以及重建方式有关;也与扫描过程中器官生理运动有关。本文首先影像引导系统XVI进行了介绍,阐述了CBCT的图像质量、CBCT
本文将形状与体积已知的模体分别置放于Conebeam CT的不同位置进行XVT扫描,并与普通螺旋CT中扫描结果及模体标称值进行比较,从而描述Conebeam CT进行XVI扫描重建精度,并检查
近日,永诚保险上海分公司在“兴业银行2009年度保险供应商”招标活动中,成功中标意外险项目。永城保险表示,该此项目的中标是永诚保险上海分公司在拓展银行保险渠道方面的新
本文介绍了钛以及钛粉的用途以及其重要性,对比了目前生产钛粉的几种方法,着重介绍了生产加工钛粉最常用的方法--氢化脱氢法.柔韧的海绵钛金属颗粒、边角钛或者废钛屑在一定
会议
本文采用仿真邮件系统得到的数据来建立社会犯罪集团网络,提出了基于社会网络中的六度定理的最短路径算法SPLINE,并在此基础上提出了犯罪集团网络核心成员挖掘算法KMM,通过实
阈值分割可分为两种:二值化和多值化.在二值化方法中,传统二维阈值分割算法大部分是在假设双峰情况下研究的,不少人将传统方法推广到多阈值分割,也有采用改进聚类分析的方案
会议