【摘 要】
:
数据挖掘研究如何从大量的数据中智能地、自动地抽取出有价值的知识和信息,是当前人工智能中非常活跃的研究领域。近年来,随着我国信息化建设的快速发展,知识的自动获取已成为制
论文部分内容阅读
数据挖掘研究如何从大量的数据中智能地、自动地抽取出有价值的知识和信息,是当前人工智能中非常活跃的研究领域。近年来,随着我国信息化建设的快速发展,知识的自动获取已成为制约其发展的“瓶颈”。因此,开展这方面的工作具有重要的理论意义和实用价值。 本文主要研究基于粗糙集理论的数据挖掘方法与技术。 在数据离散化方面,本文分析了各种属性离散化方法的优缺点,并针对决策表提出了一种新的离散化方法。该方法通过利用决策属性提供的分类信息对属性值空间进行离散化,不仅避免了复杂的聚类运算,而且使离散化结果保持了较高的数据一致性。 在不完备信息系统下的粗糙集理论扩充方面,本文提出了一种变精度粗糙集模型。该模型通过引入模糊技术,使其能够在不同的概念层次上有效地进行知识约简。 在获取决策规则方面,针对不同用户的具体兴趣不同这一实际情况,本文给出了一种加权决策规则的提取算法。该算法以本文提出的决策规则支持度为依据,从候选规则集中选取用户感兴趣的规则,为知识挖掘提供了新的思路。 本文从数据预处理、知识约简和规则抽取三个方面入手,对粗糙集理论的推广应用做了有益的探索。但是,数据挖掘正处于发展阶段,粗糙集理论在数据挖掘中的应用还有许多问题值得研究。本文的研究工作是一个尝试,相关工作还有待进一步深入。
其他文献
机器学习的方法在数据挖掘领域有广泛的应用。在当今的机器学习领域,人们经常采用多预测模型的方法以提高预测的准确性。所有这些多预测模型方法可以归为两类:(1)专家方法 (2)
Petri网是一种用于描述系统的动态行为和分析系统的动态性质的数学模型,对描述和分析并发现象有其独到的优越之处,非常适合于异步并发系统的建模。为了刻划同系统行为密切相关
随着计算机网络通信技术和多媒体技术的飞速发展,计算机支持的协同工作(ComputerSuppoSedCooperativeWork,简称CSCW)已成为当前计算机科学领域一个十分活跃的研究课题。目前计
石油储备涉及到国家的能源安全,在能源不可再生且消耗持续增长的现状下日益受到各国重视。同时随着遥感技术的进步,利用卫星影像监测地物目标已经成为获取情报的重要途径之一。
智能化信息检索是人工智能和信息检索相结合的产物.该文在研究了传统信息检索算法的基础上,运用现有检索模型对原有算法做出了改进,并给出了改进展开式算法和两种改进二叉树
视频编码技术在数字电视、高清晰度电视、可视电话、会议电话和多媒体等视频通信服务中起着至关重要的作用.H.264是ITU-T提出的最新视频编码协议,它采用了许多与以往协议不同
为了实现XML的查询优化,近年来人们相继提出了很多索引技术和连接算法[12,13,14,15,16,23,24]。这些索引主要是根据边标签和元素值建立的。然而有的索引不包含所有的元素结点,
随着现代办公的多样化、复杂化以及对办公的高效率要求,办公自动化快速的发展起来并且应用范围日益广泛,对于推动企业和工作部门的整体快速发展、提高工作效率、增强竞争实力起
串匹配是计算机科学中一个基本、重要的研究问题,它在Internet网络信息搜索、生物信息学、网络入侵检测、网络远程教育、电子商务等领域具有广泛的应用.该文围绕精确串匹配、
弹条是轨道扣件的关键部件,是用棒状弹簧钢加热弯曲成型的空间曲梁杆件,结构复杂,设计要求高,设计工作量大,产品需求量大,其性能质量关系到列车行车安全.随着铁路的提速,其结