论文部分内容阅读
与数据和噪音的存在的固有的稀少,聚类的高维的数据是为聚类算法的严肃的挑战。一个新线性歧管的聚类方法被建议处理这个问题。基本想法是寻找线歧管的在数据集隐藏的簇,然后保险丝一些线歧管构造的簇更高维歧管簇。直角的距离和正切距离是一起被考虑线性歧管距离度量标准。空间邻居信息充分被利用构造歧管的原来的线并且在线期间优化线 manifolds 歧管簇寻找过程。在真实、合成的数据集合上从实验获得的结果在一些竞争以精确性和计算时间聚类方法上表明建议方法的优势。建议方法能高获得与不同尺寸为各种各样的数据集合聚类精确性,歧管