论文部分内容阅读
k-prototypes是处理包含数值属性和分类属性混合数据主要的聚类算法,但由于对初始点的随机选择极易使聚类结果陷入局部最优,导致聚类结果的偏差。为改善聚类结果对初始点的依赖,采用遗传算法对初始点进行全局最优搜索。改进后的方法有更高的稳定性和对大数据集更快的收敛速度。数据集仿真结果表明改进算法正确、有效。