基于粗糙集的数据挖掘算法的研究与应用

被引量 : 0次 | 上传用户：lantianaaaaa

【摘要】

：

数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,是当前人工智能研究中非常活跃的领域。粗糙集理论是一种有效地处理模糊性和不确定性问题的数学工具,为数据挖

【作者】

：

洪雪飞

【发表日期】

：

2008年期

【关键词】

：

数据挖掘粗糙集属性约简决策树风险评估

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,是当前人工智能研究中非常活跃的领域。粗糙集理论是一种有效地处理模糊性和不确定性问题的数学工具,为数据挖掘的研究提供了新的思路和基础。本文主要围绕基于粗糙集的数据挖掘,针对传统数据挖掘处理噪声数据不力的问题,从理论和应用两个方面对挖掘方法进行了深入的研究。本文的主要工作包括:(1)在可变精度粗糙集理论下对经典粗糙集的概念进行了重新的诠释;分析了粗糙集理论在数据挖掘应用中的理论根据和基本原理,并点出了研究的方向。(2)结合信息论,提出了基于信息熵的属性约简算法。该算法以属性的核作为计算约简的出发点,以过滤分辨矩阵作为选择候选属性的依据,以条件属性和决策属性的信息熵作为启发信息,来寻找决策信息系统的最小约简。实验证明,该算法和经典的启发式算法相比,能够降低当噪声数据存在时漏失有效属性的风险,加快属性约简的速度。(3)提出基于变精度粗糙集的决策树改进算法。该算法采用β-边界域作为选择分类属性的标准,因此解决了不能对噪声数据进行分类的问题。另外,该方法还对规则置信度进行了重新定义,从而提高了决策树的可理解性。实验结果表明,该方法更加实用、易于理解且能明显地提高分类的效率。(4)在研究、分析了车站建设施工数据和施工安全风险的基础上,提出了对轨道建设施工安全风险进行预测的一系列数据挖掘方法。首先,对数据进行清洗、转换和离散化,并给出数据的集成方法;然后,运用改进的属性约简算法,对31个属性进行约简得到13个条件属性。最后,在完成预处理的基础上,采用基于变精度粗糙集的决策树改进算法对1021条施工安全数据进行了分类分析,建立起轨道建设施工安全风险评估模型,并在此基础上初步开发了一个基于粗糙集的数据挖掘系统。本文实验结果表明,本文改进的基于粗糙集的算法对噪声数据的处理可行、有效。

其他文献

MEMS微镜扫描激光雷达发射光学系统设计

MEMS微镜扫描激光雷达具有视场和分辨率可电控、体积小、重量轻等突出优势,是车载激光雷达的重要发展方向。本论文以MEMS微镜扫描激光雷达的研制为背景,研究了基于MEMS微镜的

学位

激光雷达MEMS微镜扫描光学系统设计

营销团队建设在成品油销售市场竞争中的应用

在新的历史时期,中国石化销售企业面临极大的市场竞争压力,营销团队建设应顺应企业战略转变,促进企业健康发展。文章结合中国石化当前的形势任务,就营销团队建设及在销售企业

期刊

中国石化销售企业竞争压力实现发展营销团队建设

单节段、双节段颈椎融合术后颈椎活动度的改变

目的:探讨单节段及双节段颈椎融合手术对颈椎活动度的影响。方法:选取2010年6月至2012年6月在皖南医学院第一附属医院弋矶山医院脊柱外科行颈椎前路减压融合术的43例颈椎病患

学位

颈椎融合手术融合节段活动度

秋山草堂图

期刊

胆舒胶囊治疗急、慢性胆囊炎的疗效观察

目的分析观察胆舒胶囊治疗急、慢性胆囊炎的临床效果。方法病例选择以门诊、住院确诊的急性胆囊炎、慢性结石性胆囊炎56例,其中急性胆囊炎20例、慢性结石性胆囊炎36例,慢性结

期刊

胆舒胶囊急、慢性胆囊炎临床效果

基于ASP模式的数字档案馆运营管理与服务研究

本文通过对ASP模式的分析,讨论了ASP模式在云环境下数字档案馆中的应用问题,从而提出ASP模式在数字档案馆建设中面临的困境与解决对策。

期刊

ASP数字档案馆业务外包SaaS

加拿大媒介素养教育的经验与启示

加拿大媒介素养的研究和媒介教育实践在近20年来取得了举世瞩目的成就,形成了具有加拿大国家特色的基本媒介素养教育理念,设置了加拿大媒介素养教育课程与推广结构,这为媒介

期刊

加拿大媒介素养媒介素养教育

跨国婚姻中的文化冲撞

<正>最近记者受西班牙一家妇女移民团体的邀请,对中国女性和西班牙男性的跨国婚姻进行一次实地调查。该移民组织希望将调查结果呈报相关政府机构,主要是解决在"不幸婚姻"中的

期刊

巴斯克人中国移民

国外优秀高山滑雪运动员年龄、身高、体重的变化趋势研究

以近三届冬奥运会高山滑雪中回转、大回转、超级大回转比赛中前6名男女运动员为研究对象，运用文献资料法、专家访谈法、对比研究法、数理统计法探讨国内外高山滑雪运动员年龄

期刊

高山滑雪优秀运动员年龄身高体重

主题酒店与酒店主题化

■主题酒店的推出在国外已有近50年的历史■虽然,主题型酒店在我国的出现还是新生事物,但可以预见的是,主题酒店已成为国际酒店业发展的新趋势,

期刊

主题酒店拉斯维加斯长隆酒店主题化

基于粗糙集的数据挖掘算法的研究与应用

与本文相关的学术论文