基于MapReduce的高效粗糙集属性约简算法

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户:sevinlee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对粗糙集理论中传统的基于正域的属性约简算法和基于信息熵的属性约简算法无法得到最小约简集的问题,给出基于信息熵改进的属性约简算法,即先使用条件熵识别出重要度值最大的属性,使用正域进行约简判断。在此基础上,设计了高效的基于MapReduce的信息熵改进属性约简算法。以真实海量气象数据为基础,在Hadoop集群上实现上述算法,验证了该算法的有效性和效率。
其他文献
本文讨论了Cauchy主值积分求积公式的收敛性,并获得了余项的估计式。
本文讨论了任意N层平面分层,每层又可具有任意柱面分层的轴对称二维非均匀有耗介质结构,分析电磁波在其中的传播、散射特性.由于采用电磁场的数值模式匹配理论,径向用离散数
2012年是“十二五”规划发展的关键之年,开发银行把握新形势要求和挑战,按照“抓重点、促发展、集中力量办大事”的总体工作思路,全面推动2011版信息化总体规划落地,统一全行数据
随着人类社会经济的发展,环境污染日益严重以及环境资源的日趋短缺问题的出现,环境资源也逐渐显示出其稀缺性。在环境经济综合核算体系中,环境资源价值估算是环境核算的核心
五河-凤阳地区具有较好的成矿地质条件,迄今为止已在该区域发现了近20处小型金矿床或矿化点,近几年也在该区域发现了如江山铅锌金银矿床等多处中小型铅锌金银矿床。本文通过同
随着全球云计算、大数据、物联网和人工智能等技术在工业领域的兴起,数据成为了工业4.0时代的核心驱动力。为了弥补Hadoop分布式系统在实时工业数据处理中显现的不足,提出基于Storm的工业流水线实时分析系统。该系统通过嵌入SDK实时采集终端数据,利用Nginx服务器将数据转换成日志文件,并采用分布式消息系统Kafka缓存,消息流入Storm进行分析处理后,将结果存入HBase中。最后从系统的保障性
查区内广泛出露地层有震旦系和奥陶系地层,岩性以灰岩、泥岩为主;第四系分布在区内低洼地带,由亚黏土、黏土夹铁锰结核构成。区内含矿地层与围岩存在明显的电性差异,对于开展电法
为研究实验室构建的两株水貂阿留申重组核酸疫苗(pcDNA3.1-ADV-428和pcDNA3.1-ADV-428-487)对水貂的免疫原性,将其经肌肉注射接种到水貂体内进行免疫,免疫完成后对水貂进行攻毒
互联网凭借其平台载体优势推动了新媒体时代的到来,全新的时代背景与教育环境对于高校思想政治教育工作也提出了新的要求。本文简要分析了当前大学生思想政治工作产生的主要
为快速求解一类线性互补问题,提出了模系瀑布型多重网格方法。该方法利用模系矩阵分裂迭代法作为瀑布型多重网格方法的光滑子,得到了满足要求的近似解。数值结果表明,该算法