基于动态聚类的Rough集快速离散化算法

来源 :西南交通大学学报 | 被引量 : 0次 | 上传用户:holyturtle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为处理大数据量决策表的离散化问题,设计高效的离散化算法是必要的.根据候选断点在单属性上重要性值的分布规律,提出了"先动态聚类,再选择候选断点"的思路和基于Rough集的快速离散化算法.首先,根据断点的重要性在单个特征上的分布规律,对断点进行快速动态聚类,从而有效降低候选断点的数目;然后,在聚类结果的基础上,采用启发式方法快速选择并得到最终的断点集,从而实现决策表的离散化.试验结果表明:通过动态聚类,多数数据集候选断点的数目能减少80%以上,大大提高了后续断点选择的效率;用提出的算法处理7个UCI数据集Ir
其他文献
前些天收到正国的短信:"老师,告诉您个好消息,我通过竞选,当上学生会副主席了。我又实现了一个小目标,希望能和您分享这份喜悦!"我回复他:"有梦想的人走得更远,飞得更高!让梦想带
作为一线教师,开设公开课是专业成长必须经历的事件。公开课的主要特点是主题鲜明、任务明确,除了学生参与听课外,还有领导、同行等临堂观摩。公开课是教师展示教学水平、交
【正】 国务院将1991年定为“质量、品种、效益”年。这项把商品质量放在首位的重要决策,明确了今年以及今后一个时期我国经济工作的努力方向和工作重点。前几年,由于受经济
以定狂逐瘀汤为基本方治疗脑外伤所致狂病30例,与用氯丙嗪治疗的30例进行了对照观察,结果治疗组总有效率为97%,对照组总有效率为90%,两组比较,有显著性差异(P<0.05)。
为探讨误差的空间分布特性对数字高程模型(DEM)粗差检测率的影响,建立了独立粗差模型和相关粗差模型,并模拟了不同粗差率(0.2%~3.0%)的数据.将随机分布的粗差加入DEM中,采用基于主成分分析的粗差检测算法进行了试验.结果表明,无论粗差是否空间相关,随粗差率增大,检测率均下降.对于独立分布的粗差,当粗差率小于1.0%时,基本可以定位所有污染数据;而对于空间相关的粗差,当粗差率等于1.0%时,检
目的:探讨慢性阻塞性肺疾病瘀、毒、痰胶滞的病理机制及化瘀解毒法治疗本病的临床效果。方法:自拟通肺净痰方治疗本病56例,并设对照组25例进行观察比较。结果:对咳嗽、咯痰、喘息
【背景分析】随着社会日益发展,街上车水马龙,为了有序地让车辆与行人安全通过,交通管理部门在城市的重要路口安装了红绿灯。各种交规出台,要求车辆严格遵守交通规则。然而,
一个意外的发现今天,户外活动时,我和孩子们一起去滑滑梯。不一会儿,琪琪惊惶失措地跑过来抱紧我:"陈老师,滑梯有电,我被电到了!"紧接着,辉辉也满脸惊慌地尖叫着:"陈老师,不得了,