论文部分内容阅读
IDGC(imbalanced data gravitation classification)在不平衡数据分类中使用欧式距离计算引力时,未能考虑数据分布性状和待测数据近邻类相关性,存在准确率低的问题,为此提出一种基于测地距离的GIDGC-KNN不平衡数据分类器模型。在IDGC基础上引入放大引力系数(amplified gravitation coefficient,AGC),结合测地距离和KNN(K-nearest neighbor)算法得到数据分布隐含的全局几何结构和近邻样本类相关性。该模型适应高维具