论文部分内容阅读
离散特征在数据挖掘的过程中具有重要的作用,如何将实际数据集中的连续特征最好地离散化是一个NP-hard问题。本文介绍了离散化方法的不同角度的分类、离散化过程中用到的术语及一般离散化的过程。同时按照离散化方法有监督和无监督的分类方法体系,介绍了儿种有代表性的离散化方法。提出需根据学习环境选择合适的离散化方法,将关联分析中连续特征离散化作为以后的研究方向。