基于粒计算的混合属性数据增量式知识获取方法研究

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:cqwzhy1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业物联网的快速普及,各领域中的海量复杂数据推动着企业的快速发展。但如何删除海量复杂数据中的数据噪音,获取对企业有价值的数据信息已经成为了当前信息科学的一大难题。此外,各领域中获取的数据在动态地变化着,如何有效利用新旧数据之间的关系对有价值的信息进行高效更新也是信息科学领域的重要问题之一。粒计算采用分而治之的策略,可以有效对动态系统中的知识进行更新,获取数据中包含的潜在价值。本文利用粒计算理论中简化复杂问题的方法及邻域粗糙集模型中混合数据的度量方式,以属性约简结果知识粒度的增量计算为技术手段,研究了混合动态信息系统中数据变化时的增量式属性约简算法。本文的主要成果包括:(1)为了提高在属性集发生变化时混合动态信息系统中属性约简结果的更新效率,本文首先分析了具有混合属性数据知识粒度的计算方式,然后探索了混合信息系统下属性增加时基于邻域模型的知识粒度增量更新的规律,基于此设计了一种针对混合信息系统中属性集变化时的增量式约简算法。并利用UCI数据集进行相关仿真实验对所提出算法的有效性进行了验证;(2)为了提高在样本集发生变化时混合动态信息系统中属性约简结果的更新效率,本文首先利用邻域模型下知识粒度的计算方式,并通过决策属性的分类将信息系统拆分为多个子信息系统,当混合信息系统中的样本增加或减少时,定义了混合信息系统中知识粒度发生变化时的增量式计算方法,提出了样本变化时混合信息系统的增量式属性约简算法。并利用UCI数据集进行相关仿真实验对所提出算法的有效性进行了验证;(3)为了进一步提高在样本集增加时大规模混合动态信息系统中属性约简结果的更新效率,本文分析已有并行式约简算法的理论成果,以混合动态信息系统中样本变化时增量式属性约简算法为理论基础,结合当前的并行模式,寻找合适的Key/Value对以及Map/Reduce函数,设计了一种并行式增量属性约简算法,为大规模动态混合信息系统的属性约简提供了有效方法。通过实验对比分析验证了所设计方法的有效性。本文利用邻域粗糙集模型对混合信息系统中的知识粒度的表达方式进行了扩展。当信息系统中属性集变化或样本集变化时,探究了混合系统中知识粒度的增量计算方法,并提出了针对混合信息系统的基于知识粒度的增量式属性约简算法,为混合信息系统中属性约简结果的快速更新提供了理论支持。通过比较分析,验证了所提出的动态属性约简算法的有效性。本文的研究工作扩展了基于知识粒度属性约简算法的应用范围,为动态混合数据环境下如何提高属性约简的效率提供新的方法。
其他文献
水稻是中国最重要的粮食作物之一。近年来,通过高产作物品种使用、现代肥料的施加、新型灌溉技术和杀虫剂的应用等,粮食产量得到了稳步提升,但粮食危机问题形势仍然严峻。在
研究滨海湿地下行效应对植物生长的影响在全球环境变化的背景下具有重要意义。大型底栖动物作为滨海湿地生态系统的重要组成部分,对植被的生长具有重要的调控作用,而潮汐湿地
大兴安岭南段地区位于中亚造山带东部,经历了地质历史上多个构造域的叠加演化时期,广泛发育中生代花岗质岩浆活动,尤其是早白垩世在板内伸展的大地构造背景下形成了一系列与
Band 3蛋白,又称人体阴离子交换蛋白(Anion Exchanger 1,AE1),是人体红细胞膜上重要的跨膜蛋白,负责介导膜内外Cl-/HCO3~-阴离子的交换,在实现CO2跨膜运输和肺部CO2排出过程
人类对能源的需求不断增加,传统化石燃料储量有限,日益突出的环境问题也促使人们发现新能源开发新技术。氢气是一种可替代化石燃料的有发展前景的新能源,使用过程不会对环境
化肥广泛用于农业增产满足人们日益扩大的需求。同时,轮作是一种兼具经济和环保生态效益的农业措施,可以增加土壤营养元素的输入,改善土壤结构,进而提高作物产量。但是,目前
MgO是铝酸钙炉渣中含量相对较多的杂质之一,在熔炼铁铝共生矿过程中,MgO会和炉渣中的其它物相反应,形成四元化合物20CaO13A1203·3MgO·3Si02(Q相),从而改变炉渣的物相组成,
本文证明了恶臭假单胞菌可以产褐藻胶裂解酶,首先筛选并合成了恶臭假单胞菌Pseudomonas putida KT2440中褐藻胶裂解酶基因(alginate lyase,Aly),基因大小为1116 bp,编码372个氨基酸。通过对比筛选出了NdeⅠ与EcoRⅠ为酶切位点进行双酶切,将酶切后目的基因连接到同样双酶切的pET-28a(+)克隆载体上,构建pET-28a(+)-Aly重组质粒,导入BL
进入21世纪以来,伴随着我国社会经济的快速发展,各种自然灾害、人为灾害和公共安全灾害等突发性事件对我国社会和人民造成了巨大的安全隐患,因此,对风险事件进行评估决策具有
一、资料与方法(一)研究对象本文对磺脲类降糖药继发失效的2型糖尿病患者共98例(其中ICA阳性者35例,占36.4%,GADA阳性者43例,占45.5%),所有患者均停用原磺脲类降糖药,随机分
会议