基于EK-medoids聚类和邻域距离的特征选择方法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:yiran87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统聚类算法中只注重数据间的距离关系,而忽视数据全局性分布结构的问题,提出一种基于EK-medoids聚类和邻域距离的特征选择方法。首先,用稀疏重构的方法计算数据样本之间的有效距离,构建基于有效距离的相似性矩阵;然后,将相似性矩阵应用到K-medoids聚类算法中,获取新的聚类中心,进而提出EK-medoids聚类算法,可有效对原始数据集进行聚类;最后,根据划分结果所构成簇的邻域距离给出确定数据集中的属性重要度定义,应用启发式搜索方法设计一种EK-medoids聚类和邻域距离的特征选择算法,降低了聚类算法的时间复杂度。实验结果表明,该算法不仅有效地提高了聚类结果的精度,而且也可选择出分类精度较高的特征子集。
其他文献
针对我国深部煤层气资源丰富,但因经济和技术条件有限,很难对其进行常规开采的问题,提出了CO2捕获、利用与封存(CCUS)技术,采用该技术不但可提高深部不可采煤层中CH4的采收率
<正>我是一个用汉语写作的藏族人。我出生于四川省西北部的阿坝藏族羌族自治州。从富饶的成都平原,向西向北,到青藏高原,其间是一个渐
近年来大数据计算已成为研究热点,Hadoop和Spark都是基于MapReduce框架的广泛应用的大数据计算平台,其性能主要取决于任务调度的优劣。因此,基于MapReduce框架的Hadoop和Spar
近年来,随着网络信息技术的蓬勃发展,不断增多的冗余数据信息充斥于互联网,这导致人们越来越难发现自己想要的信息,信息过载问题产生。信息过载问题催生了众多行业和领域对个
岩石波速随应力的变化对研究损伤演化具有重要意义。采用颗粒流程序建立9种不同模型,在模型内设置激发源和接收器,通过对激发源施加速度脉冲并记录接收器信号模拟波的传播与
高校思想政治教育是高校教育的重要组成部分,也是提升学生思想政治素养的基本途径。思想政治教育过程中需要与学生之间形成良好地联系与互动,才能实现思想政治教育目标,而在
MgO为重要的功能型材料,磁隧道结(MTJ)以MgO薄膜作为势垒层时在室温下具有巨大的隧穿电阻效应。实验采用冷等静压(CIP)工艺将高纯MgO粉末(纯度>99.99%)压制成相对密度为60%左
信息大爆炸时代,甄别出真正意义上的知识尤为紧迫和重要。然而,由于旅游管理的研究具有多学科介入的特性,旅游研究所生产的知识很难以单一学科标准进行评判,因此从知识论视角
在微波辐射及无溶剂的条件下,氯化镉催化芳香醛、β-酮酸酯和尿素发生Biginelli缩合反应合成了系列3,4-二氢嘧啶-2-酮类化合物.结果表明,当n(苯甲醛)∶n(β-酮酸酯)∶n(尿素)