对区间值属性决策树分类的一种割点快速筛选法

来源 :2004年全国理论计算机科学学术年会 | 被引量 : 0次 | 上传用户:camino
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在众多的决策树归纳学习问题中,属性取值一般被认为有两种.一种称之为"符号"值属性,另一种称之为"连续"值属性.对这两种值属性均有较成熟的处理方法,如基于最小不确定性的Min-A算法、基于最小分割信息熵的处理连续值属性的ID3算法.而区间值或模糊值作为属性值将提供一种特殊的不精确信息,区间值能充分保证模糊数据所包含的信息的完整性,而且这种以区间值表示的数据广泛存在于我们现实的生活中,如病人的创口大小、用药周期等.目前的大多数模糊决策树示例学习都是在假定属性取值及分类值是以隶属度确定的前提下建立的.本文采用区间值为属性来表示、处理这种不确定性,并通过备选割点优化选取,以增进这种学习方法在以区间值表示的不确定性信息处理方面的优势,特别是提高分类决策的效率,降低计算复杂度.本文使用基于类的信息熵极小来选择区间值扩展属性,通过覆盖频繁点和非频繁点分析改进了算法的效率.
其他文献
目的探讨应用PDCA循环法规范医院甲状腺手术、乳腺手术、腹股沟疝手术3种Ⅰ类切口手术围术期预防用抗菌药物合理使用的效果。方法运用PDCA循环方法收集资料,找出存在问题,分
近年来,个人住房贷款规模在银行资产中的比重迅速上升的同时,个人住房贷款的风险开始慢慢凸现,最终不少商业银行自己成了最大的受害者。对商业银行目前开展住房消费信贷所面
一、引言肝性脑病是指肝细胞衰竭时伴有意识障碍的一种综合症,常见的肝昏迷是其极期,而其前驱期因无明显症状不易发现。近年来,国外着眼于其前驱期的研究,并称之为亚临床肝
【病例1】女,4岁,体质量19.5 kg。因口腔溃烂3d伴手足皮疹1 d,于2011年8月16日以手足口病收住我院。入院时检查:t37.3℃,P 100次·min~(-1),R 26次·min~(-1);神清,精神可;手
期刊
模式识别分类器的设计中,智能主体学习以及数据挖掘的信念网络的学习都离不开概率密度函数,而现实中概率密度函数往往是未知的,概率密度函数的估计便成为解决这类问题的有效
会议
进化计算是一类借鉴生物遗传与进化思想发展起来的搜索方法.进化计算的特点是使用了一种群体搜索机制,使算法不易过早地陷入某个局部极值点.进化计算的算法设计简单、应用领
会议
对于数据库领域,不管是传统的管理信息系统,还是数据挖掘系统,数据的正确性一直是人们非常关心的问题.人们使用了许多的方法来对数据进行约束,例如:通过定义列的数据类型、大
基于规则的产生式系统是人工智能的一个重要研究领域,其系统中规则库和事实库的规模往往很大,90%的运行时间都花费在了模式匹配中.因此,提高匹配的速度和效率尤为关键.RETE模
会议
【病例】患者,男,72岁。因发现血糖高10余年,双下肢麻木2 a,咳嗽、咳痰4 d,于2010年9月15日收住入院。既往有高血压、冠心病、慢性乙型肝炎、腰椎间盘脱出、脂代谢异常、胆囊
期刊
20世纪90年代初,著名学者钱学森等人提出了开放的复杂巨系统及其方法论--从定性到定量的综合集成法.按照开放的复杂巨系统理论,人是一个复杂巨系统,信息网络是一个开放的复杂
会议