基于粗集的数据挖掘技术及其应用研究

被引量 : 0次 | 上传用户:lianjinling27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对信息社会中数据和数据库的爆炸式增长,人类分析数据和从中提取有用信息的能力,远远不能满足实际的需要。虽然数据库管理系统可以高效地实现数据的录入、检索和维护等管理功能,但是却不能发现数据库中的关联和规则,也不能根据现有的数据预测未来的发展趋势。所以迫切地需要一种智能地、自动地把数据转换成有用信息的技术和工具。 需求是发展之母,数据库管理系统和人工智能中机器学习两种技术的发展和结合,促成了在数据库中发现知识(KDD)这一新技术的诞生。1989年8月,在美国底特律召开的第11届国际人工智能联合会议的专题讨论会上,首次提出KDD。KDD是一门交叉性学科,涉及机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等领域,内涵极为广泛,理论和技术上的难度也很大,从而使针对大型数据库的KDD技术一时还难以满足应用的需要。于是,1995年的美国计算机学会(ACM)会议提出了数据挖掘(Data Mining)的概念,它形象地把大型数据库看成是存放有价值信息的矿藏,通过有效的知识发现技术,从中挖掘或开采出有用的信息。 所谓数据挖掘也称为知识发现,是从大型数据库和数据中提供潜在价值的知识和规则的过程。数据挖掘技术有各种模式,如关联分析、分类和预测及聚类等。各种模式各有侧重,其中有一些已经研究得较为成熟,研究成果也较多,如挖掘关联规则、预测方法和分类模式中的一些其他方法。而分类模式中关于粗集的挖掘技术目前研究的人还不是很多,相应的研究成果也较少。因而基于粗集的数据挖掘技术有很大的研究价值。粗集理论是针对不确定性问题提出的,它的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,从而找出该问题的内在规律。 基于粗集理论的数据挖掘技术可以用来从大型数据库中挖掘出有用和用户感兴趣的知识来,解决现代企业中数据多而信息少的问题。从某种意义上说,通过粗集理论挖掘出的分类规则是系统通过自学习机制而产生的,因而可以解决知识自动获取的瓶颈问题。因此,研究基于粗集的数据挖掘技术有着重要的理论和现实的意义。 本文在总结和借鉴前人经验的基础上,对基于粗集的数据挖掘技术进行了 哈尔滨」_:程大学博士学位论文‘亩奋‘亩奋亩亩亩奋亩奋奋亩石亩系统的研究。原来人们对粗集的挖掘算法的研究主要是针对相容决策表进行的,本文不仅研究了相容决策表的挖掘算法,同时也对不相容决策表的挖掘算法以及产生的不确定性规则的推理策略进行了研究,从而使基于粗集的挖掘技术更加完善。 在论文的第4章,对于粗集挖掘技术的两个主要的数据预处理过程,即决策表数据的离散化和空缺值的补齐进行了研究。另外,本文还提出将云模型和粗集理论结合起来进行数据挖掘和推理,并对二者的结合模式进行了探讨。 在第6章和第7章,论文对基于粗集的数据挖掘技术在管理领域中的应用进行了探讨,包括在供应链合作伙伴评价选择和企业资信评级中的应用。供应链合作关系和企业的资信评级在市场经济条件下显得尤为重要,应用基于粗集的挖掘技术,不仅可以有效利用大量的历史数据和评价结果,又可以借助于信息技术提高评价工作的效率和改善工作效果。 在第6章,论文对合作伙伴评价选择的综合指标体系进行了设计,在此基础上运用粗集来对历史的评价结果数据进行挖掘,最终得到用于合作伙伴评价选择的分类规则。 在最后一章,论文利用粗集的属性约简算法自动获取了企业债券财务质量评级的指标体系,并最终得到债券财务质量评价的规则。另外,在本章论文还提出一种基于粗集理论的属性权重确定方法,该方法将由历史数据确定的属性的客观权重和专家的主观先验权重结合起来,最终得出主客观相结合的综合权重。论文最后利用该方法对企业债券进行评价并得到了评价的结果。
其他文献
针对高空作业吊篮现场工作环境特殊状况,增加脚轮、万向顶轮且材质选用改变、钢丝绳缠绕装置之导向装置选材改进、安全锁固定架螺栓连接改为焊接加固等保护装置及连接方式,使
研究目的:总结日本国土综合开发规划的演变规律,为中国国土规划工作的开展提供借鉴。研究方法:文献资料法,对比法。研究结果:与日本的国情和经济阶段相适应,日本的国土规划在
原油生产和石化行业污水处理构筑物底部排出的污泥含水率高,充分乳化而难以自然沉降,如不加以处理而直接排放,不仅会造成环境污染,而且对污泥中所含的原油也是一种浪费。本论文通
水泥混凝土路面快速薄层修补方法是近年新出现的水泥混凝土路面修补方法。这种修补方法能充分利用老混凝土路面的剩余强度和模量,提高路面结构承载能力,恢复路表使用性能。该修
铝钙渣系是近年发展起来的新型合成精炼渣,主要用于LF炉钢水脱硫、去除夹杂物,以达到净化钢液的目的。预熔型精炼渣是目前国内外冶金工作者研究的重要对象之一,而根据不同的钢种
目的:探讨电针大椎、百会穴治疗血管性痴呆(VD)的疗效和可能机制。方法:将Wistar大鼠随机分为假手术组、模型组、电针组和喜得镇组,采用改良的四血管阻断法建立血管性痴呆模型。
90年代以来,伴随着外商投资领域的扩大,国际资本开始选择多种方式介入中国的大型基础设施建设。其中BOT(BUILT-OPERATE-TRANSFER)投资方式一度成为热点。采用这种投资方式时,投资者和经营者首先从政府或所属机
目前公司机车、工程车、地铁及动车等车辆用户对车辆布线提出了非常高的要求,要求达到"艺术化"布线效果。公司组织开展轨道车辆艺术化布线工艺方法研究。旨在提升车辆的制造质
二十一世纪是知识经济的世纪,发展高新技术是知识经济的必然要求。风险投资则成为高新技术成果转化的催化剂。有效的风险投资项目的评估与决策可以降低风险投资的各种风险,提高
在当今飞速发展的信息时代,广播、电视、通信是发展最快的产业之一,而移动通信更是渗入到千百万人们的日常生活当中。为满足不断增长的移动通信话务需要,要求增加城市环境的微蜂