【摘 要】
:
属性约简是Rough集研究的重要内容之一。所谓属性约简是指在保证信息系统分类或决策能力不变的条件下,删除条件属性中的冗余属性,从而减少数据挖掘要处理的数据量,提高数据挖掘结果的简洁性。国内外学者在这方面做了大量的研究,提出了多种属性约简算法。如基于正区域的属性约简算法,基于Skowron提出的区分矩阵的约简算法和基于信息熵的属性约简算法。然而属性约简的求解是一个NP困难问题,导致该问题的主要原因是
【机 构】
:
厦门大学系统与控制研究中心,厦门 361005;漳州师范学院计算机科学与工程系,漳州 363000
【出 处】
:
第七届中国Rough集与软计算、第一届中国Web智能、第一届中国粒计算联合会议(CRSSC-CWI-CGrC2007)
论文部分内容阅读
属性约简是Rough集研究的重要内容之一。所谓属性约简是指在保证信息系统分类或决策能力不变的条件下,删除条件属性中的冗余属性,从而减少数据挖掘要处理的数据量,提高数据挖掘结果的简洁性。国内外学者在这方面做了大量的研究,提出了多种属性约简算法。如基于正区域的属性约简算法,基于Skowron提出的区分矩阵的约简算法和基于信息熵的属性约简算法。然而属性约简的求解是一个NP困难问题,导致该问题的主要原因是属性的组合爆炸。目前还不存在一种非常有效的方法,因此寻求快速的约简算法及其增量版这一问题仍是粗糙集理论的研究热点之一。本文根据当属性集合A的条件信息熵等于属性集合AU{a}的条件信息熵时,属性a不能为属性集A添加任何分类信息,可以将a删除为基础。对CEBARKCC算法进行改进,从而减少了不必要的计算,节省了时间。
其他文献
小方坯连铸GCr15轴承钢容易在凝固过程中产生宏观偏析,而凝固过程的工艺参数决定了宏观碳偏析的产生原因。本文通过分析小方坯连铸轴承钢的实际生产条件,建立了小方坯连铸凝固传热数学模型,并进而探讨了凝固冷却的基本规律,指导进行修正、优化连铸工艺参数,改善宏观碳偏析。
高炉在既定的操作人员与特定设备下,其喷煤量的均匀稳定性主要取决于喷吹用煤粉的输送性能。本文主要介绍了测量粉体流动性的主要方法,包括Carr指数法、Jenike流动函数法及粒度分形维法。并采用Carr综合指数测量法对多种煤粉进行了实验检测,针对实验结果对煤粉流动性进行了分析。
通过改变马钢2号300m2烧结机前进方向各风箱抽风负压来对整个烧结过程垂直烧结速度进行分段调整,达到了合理优化垂直烧结速度的目的,使烧结矿产质量均有不同程度的提高,并且也使带冷废气温度更高且平稳,有力支撑了带冷废气余热发电。
干熄焦技术作为集环保、节能、改善焦炭质量等诸多优点于一身的新工艺,能够适应现代化的大型高炉生产,鞍钢已经采用了该项技术。本文对在鞍钢使用的结果和存在的问题进行了讨论,并提出了改进的建议。
本文首先建立配水操作指导模型,利用调节配水来稳定烧结终点,能够提前15min给出配水调整的建议。并在此基础上建立自适应模型,现场运行显示模型输出的配水调整建议具有一定可靠性。
遗传算法(Genetic Algorithm,GA)是基于自然界“适者生存”机制的一种全局优化算法。它将问题的可行解编码为由基因组成的染色体,通过模拟染色体群的选择、交叉和变异等操作,不断迭代,最终收敛到高适应度值的染色体,从而求得问题的最优解。遗传算法的基本特征是通过在代与代之间维持由潜在解组成的种群来实现多向性和全局搜索,这种从种群到种群的方法在搜索Pareto解时是有用的。首先,它能同时处理
在有些场合,需要找出函数的多个甚至所有极值点,这类问题被称为多峰搜索问题。为了求解多峰搜索问题,可以通过引入小生境和物种理论,用分享和限制交配机制相结合的方法来实现多峰搜索,该方法是以峰个数已知和峰均匀分布的假设为基础的;另一种方法是通过把函数进行变换,使所有峰等高且被找到的机会均等,再用改进后的遗传算法进行搜索;文[4]把这种思想进行了发扬,用微粒群算法来进行实现。通过分析可以发现,用微粒群算法
目标识别是图像处理和模式识别领域的研究热点,在生物医学领域有着十分广泛的应用前景,如肺癌、食道癌及子宫癌细胞的识别分类等,并且取得了一些可喜的成果。对图像目标的精确分割是医学图像模式识别的重要基础之一。在肺癌细胞识别的应用中,大多数的肺癌细胞图像中细胞核与胞浆之间对比度较低,细胞核边缘与背景之间的边界模糊,再加上背景杂质噪声的影响,这都使得很难对肺癌细胞图像进行较精确的分割。本文介绍强化学习的基本
数据挖掘是指从大量数据中提取出有效的、新颖的、潜在有用的,以及最终可理解的模式的高级过程。其目的是从数据中抽取知识。而分类知识是反映同类事物共同性质的特征型知识和不同事物之间差异型特征知识。从带有类别标号的事例中获取分类知识是现实中经常要解决的问题。所谓分类,就是根据确定的概念外延导出概念的内涵,以便区分新的概念外延,即能够用模型或函数预测那些类标记尚未可知的对象。因此,分类是一种有类标记指导的学
Rough集理论是由20世纪80年代波兰人ZPawlak提出的一种新的数学工具,它通过严格的数学公式来处理不精确性、不确定的问题,具有演绎、归纳和常识推理等能力,因此,Rough集理论很快就在机器学习、知识获取、决策分析、数据库知识发现、专家系统和模式识别等方面得到了广泛的应用。现在许多学者对Rough集理论进行了进一步延伸与扩充,如粒及其粒计算相关理论;也有学者把Rough集理论与数学知识相结合