【摘 要】
:
面对广泛存在的混合属性数据,现有大部分混合属性聚类算法普遍存在聚类质量低、聚类算法参数依赖性大、聚类类别个数和聚类中心无法准确自动确定等问题,针对这些问题本文提出
【基金项目】
:
浙江省自然科学基金(Y14F020092);宁波市自然科学基金(2013A610070)资助~~
论文部分内容阅读
面对广泛存在的混合属性数据,现有大部分混合属性聚类算法普遍存在聚类质量低、聚类算法参数依赖性大、聚类类别个数和聚类中心无法准确自动确定等问题,针对这些问题本文提出了一种基于密度的聚类中心自动确定的混合属性数据聚类算法.该算法通过分析混合属性数据特征,将混合属性数据分为数值占优、分类占优和均衡型混合属性数据三类,分析不同情况的特征选取相应的距离度量方式.在计算数据集各个点的密度和距离分布图基础上,深入分析获得规律:高密度且与比它更高密度的数据点有较大距离的数据点最可能成为聚类中心,通过线性回归模型和残差分析确定奇异点,理论论证这些奇异点即为聚类中心,从而实现了自动确定聚类中心.采用粒子群算法(Particle swarm optimization,PSO)寻找最优dc值,通过参数dc能够计算得到任意数据对象的密度和到比它密度更高的点的最小距离,根据聚类中心自动确定方法确定每个簇中心,并将其他点按到最近邻的更高密度对象的最小距离划分到相应的簇中,从而实现聚类.最终将本文提出算法与其他现有的多种混合属性聚类算法在多个数据集上进行算法性能比较,验证本文提出算法具有较高的聚类质量.
其他文献
为探讨某型固体火箭发动机药柱前端壳体/绝热层、绝热层/包覆层、包覆层/推进剂界面裂纹在点火发射时的稳定性,采用3维黏弹性有限元方法,通过在3维J积分柱面内脱黏裂纹尖端上
<正>曾几何时,《雍正王朝》《康熙王朝》《成吉思汗》《汉武大帝》《贞观长歌》等一大批优秀的历史正剧在全国掀起一个又一个收视热潮,然而近几年来,历史正剧越来越少,代之而
针对研究固体火箭发动机药柱出现裂纹前、后药柱内应力/应变场的需要,提出利用奇异单元和生死单元技术模拟含三维裂纹药柱的新方法,并利用该方法对固体火箭发动机三维非贯穿
以9yk-0.4d型环模式压块机模孔的结构参数为依据,自行设计了试验装置,在wdw- 10e型微机控制电子式万能试验机上进行压缩试验,并利用电测技术对压块过程中秸秆在模孔内不同位
采用基于DM8168的硬件平台,利用丰富的外围接口扩展视频服务器的各种通讯接口和音视频接口。在DM8168的DSP中植入以高斯模型获得背景图像,以当前图像与背景图像差获得目标,根
改革一方面带来了我国经济的高速增长,另一方面也越来越被利益集团引向歧路。强势利益集团通过与官僚权贵结成非正式利益同盟、要挟中央政府以及形成抵制改革的心理预期等方
对多个体协调控制问题的研究现状进行综述.介绍了多个体协调控制领域的基本问题,并结合系统中网络与动力学不确定性,对该领域当前的研究热点和前沿进行分析阐述.进一步,对工
<正>陈再道,中国人民解放军上将。他17岁参加革命, 历任排长、连长、营长、团长、师长、军长。抗日战争开始时,年仅28岁的陈再道就担任了八路军一二九师三八六旅副旅长。按说
<正> 新中国成立后,老牌资本主义国家英国表现出了与美国不同的姿态,很快就宣布对中华人民共和国的承认。中国政府根据毛泽东确定的外交原则,对英国作出了慎重的回应。当代中
A pseudospectral method is presented for direct trajectory optimization of optimal control problems using collocation at Chebyshev-Gauss points,and therefore,it