论文部分内容阅读
连续属性的决策表知识获取有两个问题需要解决:其一是连续属性的离散化问题。这个问题已引起人们的注意,在简单评述的基础上,结合粗集理论,提出了一种新的数据离散化方法。大致思想是先用K-W检验方法粗略评价各连续属性的重要性,然后用c均值聚类给出各属性的量化结果。若决策表不相容,则按属性重要性依次增加分类的区间数,如此反复直到决策表相容为止。其次是最优属性的选择问题。有此借助于简约格和模拟退火算法,给出一种启发式算法和最优算法。实例表明,上述方法是有效的。