训练基于EP的分类器以提高分类的准确性

来源 :2005第一届中国分类技术与应用研讨会(CSCA) | 被引量 : 0次 | 上传用户:xiestephen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显露模式(EP)是支持度从一个数据集到另一个数据集发生显著变化的项集.EP具有很强的区分能力,可以建立很好的分类器.提出了一种可调整权值的基于EP的分类方法CEPAW(classificationbyemergingpatternswithadjustableweights).CEPAW使用基本显露模式(eEP)并聚合eEP的区分能力建立分类器.在聚合eEP的区分能力时,eEP的权值通过训练自适应地选取.与以支持度为权值的方法相比,CEPAW可以选取更合理的权值来聚合eEP的区分能力.在UCI机器学习数据库的11个基准数据集上的实验表明,CEPAW的分类准确率足以与NB,C5.0,CBA,CMAR,CAEP和BCEP等优秀分类法相媲美。
其他文献
1临床资料我科自1990年4月~2001年12月遇到小儿鼻腔异物误诊为慢性鼻炎15例,年龄3~10岁,男10例,女5例。病程2个月~2年。异物种类:纸团5例、纽扣2例、花生米2例、棉片2例,橡皮2例,珠子1例、石子1例。患儿均有单侧鼻塞
期刊
如何能有效地保持原本学习过的知识,又能不断获取新知识?这是增量学习面临的难题.将集成学习算法移植应用于增量学习,建立了模块化增量学习模型,研究了BehaviorKnowledgeSpac
会议
皮肤粘膜出血 :这是 HFRS最常见的出血部位。发热期可以发现有前胸和腋下皮肤呈点状或抓痕样出血点。软腭和咽后壁粘膜呈片状针尖样出血点。休克期和少尿期主要表现是前臂、
期刊
哮喘持续状态是指哮喘急性严重发作 ,经合理应用拟交感神经药物仍不能在 2 4小时内缓解 ,属于危重型哮喘 ,是引起哮喘病人死亡的主要原因。因此国内外均对此类病人的早期诊断
期刊
缺失数据的处理是数据挖掘和学习分类系统中的重要问题之一.在传统的学习分类系统中,有两种处理缺失数据的方法:①通过统计已知数据预测缺失数据;②将缺失数据标记为"任意值
会议
近日从江苏省卫生厅获悉,江苏省积极开展婚姻保健、孕产期保健、儿童保健以及出生缺陷监测和预防、使用合格碘盐、健康教育等综合性防治工作,有效地预防和减少了出生缺陷和残疾
期刊
数据挖掘的一个重要方法是采用机器学习技术产生分类器.将分类器集成到一起将会大大降低分类错误率.传统的助推方法是适合任何分类器的,而针对决策树的助推方法将进一步提高
最小最大模块化分类器是一种具有弹性的任务分解和简单的结果合成的组合分类器框架.已有研究表明,最小最大模块化分类器任务分解的一种有效策略是使用聚类或者逆向聚类方法.
会议
RSOM树由SOM网络自适应生长形成,具有良好的自学习能力和自适应增长能力,在模式识别中表现出良好的性能,而通常的模式识别问题包含大量复杂的计算,因此,研究RSOM树的并行算法
会议
为解决分类数据、高维数据中的异常检测问题,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显著性的异常存在判别准则,实验结果表明该判别准则可有效