基于粗糙集的特征选择算法研究

被引量 : 9次 | 上传用户：wjief

【摘要】

：

粗糙集理论(Rough Set Theory)是波兰数学家Z. Pawlak于1982年提出的一种处理模糊、不确定数据的软计算方法,是目前国际上人工智能理论及其应用领域中的重要研究热点之一。由

【作者】

：

李超伟

【发表日期】

：

2013年01期

【关键词】

：

粗糙集特征选择属性排序粗糙集类库属性相异系数

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

粗糙集理论(Rough Set Theory)是波兰数学家Z. Pawlak于1982年提出的一种处理模糊、不确定数据的软计算方法,是目前国际上人工智能理论及其应用领域中的重要研究热点之一。由于粗糙集理论方法独特、思想新颖,在提出的三十余年里面,吸引了大量研究人员对其进行研究,并成功的衍生出模糊粗糙集、优势关系粗糙集、决策理论粗糙集、变精度粗糙集等多种适用于处理复杂类型数据的粗糙计算模型。这些模型已成功应用于机器学习、模式识别、决策支持、过程控制、数据库知识发现、专家系统等研究领域。基于粗糙集的特征选择(属性约简)是粗糙集理论研究的核心内容之一,主要是在保持原始数据的属性区分能力不变的前提下,选择具有最小特征(属性)数的特征子集,达到消除无关和冗余特征,提高知识发现效率,改善分类器性能的目的。随着目前大量高维海量复杂数据的出现,这种解决问题的思路对于处理具有高价值总量、低价值密度、含有大量冗余属性的大数据研究具有重要的意义。本文跟踪国际学术前沿,对基于粗糙集理论的属性约简进行整理分析,在借鉴PageRank算法思路的基础上,提出了通过对属性进行“全局性”重要度排序,进而构造一种新的属性约简算法。另外,总结已有粗糙集特征选择的部分方法及数据集的预处理方法,设计了包含粗糙集特征选择与数据集预处理方法的RS Library类库,在类库的基础上设计了粗糙集特征选择系统。本文主要工作如下：(1)启发式属性约简算法的分析与比较。对经典的启发式属性约简算法、启发式约简加速算法、启发式约简双向约简加速算法分别进行了具体的分析和比较。(2)提出一种基于“全局性”属性重要度排序的特征选择算法。将粗糙集理论与PageRank算法结合,借鉴其投票机制,提出了属性排序算法(AttributeRank),进而设计了基于属性排序的特征选择算法。在处理海量数据时,该算法的并行版本能够在可接受时间内得出结果。(3)设计了基于粗糙集的特征选择系统。针对在粗糙集学习中,做实验时,需要编写大量重复性代码、检验编码正确性、对比实验结果、对书局集进行大量预处理等工作,设计了包含常见粗糙集属性方法与数据集预处理的粗糙集类库。在此类库的基础上开发了基于粗糙集的特征选择系统。最后,将本文内容进行总结,说明了针对该类问题可以深入研究的方向。这些研究内容,探索了将属性约简并行化的方法,为大数据的数据挖掘提供有价值的参考。同时,进一步丰富了基于粗糙集的数据挖掘算法,为发展高效的数据挖掘方法提供一定的借鉴和指导,借此进一步推动并促进该领域的发展。

其他文献

英美人名汉译问题

长期以来,外国人名汉译一直处在翻译学科边缘,不被广大译者真正重视,随意翻译而导致信息错乱的现象时有发生,对同一外国人的人名的汉译可谓五花八门,这不仅不利于读者获取所

学位

英汉翻译英美人名翻译准则

中国保险欺诈防范研究

随着中国保险业的持续快速健康发展，保险欺诈风险逐步显现，作案人员专业化、团伙化，手段智能化，资金巨额化、跨境犯罪等特征明显，保险欺诈案件在部分地区、个别领域成高发态势，反保

学位

保险欺诈保险反欺诈防范对策

席慕蓉作品中的禅意

席慕蓉的作品有一个共同的特色:感悟人生、感悟爱情、感悟生命。正是这"感悟"二字,使我们可以从她的作品中体味到浓浓的禅的意味。

期刊

席慕蓉作品禅意

东亚地区货币竞争与人民币国际化研究

自第二次世界大战结束以来，国际货币体系一直由美元所主导，客观地说，这种体系对世界经济的增长与稳定曾作出过巨大贡献，但随着其他发达国家及新兴市场经济体的相继崛起，美元作为主

学位

货币竞争美元化去美元化人民币国际化

基于改进双因子模型的装配过程人员可靠性

从分析人为失误机理的角度出发,把复杂的装配过程分解为工人的基本行为单元,以此作为研究对象,通过复合分层故障树分析提取人为失误的影响因素,把影响因素水平和该因素影响行

期刊

人员可靠性双因子模型粒子群优化基本行为辨识和评价

大脑镰及矢状窦旁脑膜瘤的显微手术治疗

目的探讨大脑镰及矢状窦旁脑膜瘤显微手术方法和疗效。方法回顾性分析34例大脑镰及矢状窦旁脑膜瘤患者的临床资料，34例患者均行显微手术治疗。结果脑膜瘤切除程度按Simpson分

期刊

脑膜瘤大脑镰矢状窦显微手术疗效

掘护互锁液压系统的研究

掘进机与临时支护搭配使用时,存在同时动作的情况,容易导致误操作造成伤人事故。针对该问题设计了一种掘护互锁液压系统,但该系统在工作过程中出现高压闭锁的故障。通过分析

期刊

掘进机互锁液压系统导压比

大同市供水排水集团有限责任公司绩效考核研究

随着知识经济的到来,人力资源管理已成为企业提升竞争力的重要手段。人力资源管理的根本目的是最大限度地发挥员工的潜能,提高企业的绩效,实现员工与企业的共同发展。绩效考

学位

供水企业绩效考核关键绩效指标(KPI)

我国建设工程质量政府监督制度沿革

期刊

建设工程质量政府监督机构《建设工程质量管理条例》

新世纪以来中国电影现实主义研究

新世纪以来，中国电影创作的现实主义传统陷入了发展困境，甚至一度在电影银幕上“缺席”。与此同时，中国电影在产业化转型的过程中出现了艺术与商业的失衡。电影现实主义如何在困

学位

中国电影现实主义生存境遇数字技术艺术样态

基于粗糙集的特征选择算法研究

与本文相关的学术论文