基于粗糙集的数据离散化算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:skgoo1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种能够处理模糊和不确定信息的有效工具,近年来在机器学习等多个领域得到了广泛的应用。在许多实际应用中,粗糙集并不能直接用来从原始的信息系统获取知识,必须对信息系统进行预处理,其中,数据离散化是预处理中关键的一步。对信息系统的有效离散化能够大大提高后续规则学习过程的效率和学习结果的性能。   论文的主要工作包括两个方面:   首先,论文对基于辅助矩阵和信息熵的两类基于粗糙集模型的主要启发式离散化算法进行实验研究,对两类算法的综合性能进行比较。结果表明,基于辅助矩阵的算法复杂度较高,较适合于处理小容量数据集;信息熵类算法的识别率虽略低于辅助矩阵类算法,但是在正确识别率方面有一定优势,而且计算时间短,在样本分布均匀和阈值选择合适的情况下适合于处理较大容量数据集。   其次,论文通过改进断点重要性的度量方式,提出了一种新的基于信息熵的启发式数据离散化算法。仿真测试结果表明,在样本分布均匀和阈值选择合适的情况下,新算法的运行时间明显缩短,而且具有较高的识别率,适合于处理较大容量数据集。
其他文献
智能视频监控是计算机视觉领域的热门研究方向和商业应用中的新兴产业,广泛应用于政府机关、银行仓库、小区医院等一些智能安防需求较多场所的实时监控。智能视频监控主要是
1961年春邓子恢向党中央和毛泽东主席提交了的报告.提出了停办农村食堂;改变农村粮食管理方式;取消供给制;耕牛和农具归小队所有;增加自留地;实行粮食生产承包;恢复供销合作
随着数据挖掘研究的不断深入,群体智能越来越受到研究人员的关注,作为其重要分支的蚁群聚类算法备受学者们的青睐。蚁群聚类算法是受蚂蚁群体行为启发而设计的智能仿生算法,具有
诚然,我们应当抓那些首次出现的新闻。但是,“二茬稿”当中也是有文章可做的。新闻报道来自新闻的本源,新闻的本源不是一成不变的,它的各个层次都存在着“变动”,变动就可能
在毛主席“备战、备荒、为人民”的伟大战略方针指引下,近年来我省各地在水稻育秧中开展了应用“五四○六”菌肥的试验,一致肯定“五四○六”对培育水稻壮秧有显著效果。一
随着互联网的出现,计算机软件所面临的环境发生了变化,由静态、封闭转为动态、开放。为了适应这种变化,软件系统从集中式逐渐演化为分布式。另外,从20世纪90年代开始,基于组
随着经济全球化,地球村的到来,势必对教育有更高的要求.那么,高中物理课堂教学应该走向何方呢?本文就该话题谈几点看法,望能有助于课堂教学实践.一、注重课堂提问的有效性,培
分形几何被称为“大自然的几何学”,诞生于20世纪70年代,主要用来刻画不光滑、不规则的几何形体。分形形态广泛存在于自然界。目前分形已经涉及到数学、物理、化学、材料科学
随着经济社会的发展以及互联网的普及,过去相对独立的、仅限于企业内部的办公自动化技术已经不能满足企业业务环境多变的需求。更多的业务要求多企业、多部门的综合的协调工
所谓物理课堂教学评价是将本节物理课所进行的教学内容作为重点评价对象,以物理教学任务作为出发点,对本堂物理课的教学成果进行客观且具有批判性的评价,换句话说,这是一种过