F-粗糙集不确定性的度量及粗糙集算法的优化

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:n464j7428bh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是一种行之有效的数学工具,可以处理不精确、含糊和不完整信息。在数据挖掘、机器学习和模式识别等领域,粗糙集理论广泛应用于分类和特征选择(属性约简)。属性约简的方法包括正域、差别矩阵和差别函数、信息熵以及属性重要度等等。本文的第一个要点是F-粗糙集不确定性的度量。F-粗糙集是一种针对信息表簇或决策表簇的新的粗糙集模型。本文利用F-粗糙集模型中上、下近似的思想,定义了不确定性概念漂移的一些度量,包括概念的上、下近似漂移量,概念的上、下近似偶合度等,并初步探讨了它们的性质。本文的第二个要点是属性约简算法的优化。在各式各样的粗糙集约简算法里划分占去了大量时间。同时,比较操作主导了划分过程。早期的采用蛮力运算策略的约简算法,在划分时需要很多时间来执行比较操作。这在约简大型决策表时是不可接受的。本文提出了一种哈希划分的方法,可以高效解决划分问题同时大幅减少比较运算的次数。本文使用哈希划分改善了决策表划分,并且和以往论文中常常采用的基于排序的划分方法做了详尽对比。通过哈希划分,耗时的比较运算明显减少,因而,很多粗糙集算法的运算效率得以提升。实验表明此方法适合于获取正域、决策表核属性、基于正域的Pawlak约简以及基于属性重要度矩阵的并行约简。本文的另一个亮点是对大数据的测试。不少声称测试了大数据的文章仅测试了10万条以下的决策表的表现。本文不仅加入了百万条数据集的测试结果,还人工合成了一张近40000000条数据、总容量为3.2GB的数据表然后进行了约简测试。最后,哈希划分同样可以改善并行约简。并行约简可以获取决策表的近似约简,实验表明加入了哈希划分的新算法优于原有算法的表现。
其他文献
根据党的十五大精神,联系冶金地质具体实际,冶金地质部门资产重组、结构优化的总体思路是:着眼于整体搞好冶金地质经济,大胆运用资产经营、资本营运的方式,推进冶金地勘经济
目的 分析在高血压肾病患者的早期诊断中通过测定血清NGAL与胱抑素C、肌酐、尿素氮等肾功能指标的诊断价值.方法 随机抽取2017年9月至2019年8月我院90例原发性高血压病例,以
[摘 要] 以2015级中医学(5+3)专业为研究对象,随机分成采用LBL实验教学方法的对照组、采用PBL+LBL的教学方法的实验组,探索在医学机能实验中医学(5+3)专业教学中,联合使用LBL+PBL两种教学法的教学效果。通过考核数据分析及问卷调查来评价,LBL+PBL教学模式能提高学生学习成绩,其教学效果明显好于LBL教学模式,值得在机能实验教学中推广使用。  [关键词] PBL教学法;LBL
目的 调查分析急诊护士遭受工作场所暴力后的心身健康状况.方法 选择2018年9月至2019年9月在我院工作的急诊护士,共200名,采用症状自评量表即SCL-90,其中80名为遭受过工作场
该论文主要研究了目标检测技术,基于轮廓信息和区域信息的面向人的运动目标的基本跟踪技术,并利用现有技术对大范围的视频监控提出了一套智能化的解决方案.论文的创新点及主
2006年9月,在西宁召开的青海省关心下一代工作会议上,一位精神矍铄的老人的发言,博得了全场热烈的掌声,这位老人就是吴启章。吴启章1959年参军,1965年听从党的召唤,毅然离开
目的 探究纤维胆道镜联合术中B超在肝胆结石手术治疗中的临床价值.方法 选取我院2017年1月至2018年1月行肝胆结石手术患者72例,按随机数字表法,分成对照组(行单纯纤维胆道镜)
目的 分析多期动态增强MRI对宫颈癌放化疗短期疗效的评价效果.方法 纳入我院在2014年2月至2018年12月,经过病理检查确诊,同时予以放化疗治疗的宫颈癌患者42例,在予以治疗前,
目的 研究CT与MR在半月板和关节软骨损伤中的诊断价值.方法 以2017年11月至2019年10月本院接诊的半月板和关节软骨损伤病患100例为对象,对其施以CT与MR检查.对比2组不同方法
目的 研究分析周围型小细胞肺癌的CT诊断与临床病理分型.方法 本院于2016年7月至2019年7月一共收治120例周围型小细胞肺癌患者,患者均经病理学确诊,均给予螺旋CT扫描检查,分