基于决策逻辑的增量学习算法研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:zhu872007990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的发展和应用,社会各部门积累了大量的数据,而且这些数据每一天都在增加,数据挖掘是发现这些数据背后隐藏的知识的有效手段。但是,如果在数据库更新之后要对全部数据重新进行挖掘,需要消耗大量的资源,这导致对增量挖掘算法的迫切需求。把增量算法与数据库的更新结合在一起,渐增地进行知识的更新,修正和加强先前业已发现的知识,从而使得修正后的知识库能够适应更新后的数据库,而不必重新挖掘全部数据。 粗糙集理论是数据挖掘的方法之一,它是处理模糊和不确定知识的一种数学工具,已在人工智能与知识发现、模式识别、智能控制、智能决策、冲突分析及故障检测等方面得到了较好应用。但是,目前基于粗糙集理论提出的数据挖掘算法主要都是针对静态数据集,考虑到实际应用的需求和粗糙集理论的现状,本文主要对粗糙集理论的增量算法进行研究。而粗糙集中的决策逻辑作为一种从信息系统中获取蕴涵于其中知识的模型,使用逻辑推演中的符号工具,能够有效发现知识的依赖性并对知识进行简化,而且能够准确的描述新增样例的状态,所以本文选择决策逻辑理论作为增量学习研究的理论基础。 本文首先对文献[15]中基于决策逻辑的增量算法的研究进行了分析,指出了其中在对新增样例进行分类的方法上存在的错误,然后通过对该理论的修正,即对新增样例设计了新的分类方法,并在此分类方法的基础上,对完备极小决策算法的增量计算进行了详细讨论,提出了基于决策逻辑的新的增量学习理论。依据本文提出的增量学习理论,设计了增量学习算法,并分析了算法的时间复杂性,理论证明增量算法较经典算法在时间复杂度上有很大的优势。最后针对时间复杂度相同的情况,通过实验对其在时间性能上进行了试验。
其他文献
为了充分认识超大规模集成电路(VLSI)中寄生电容、电感的大小以及分析电机电磁场的需要,本文设计实现了求解泊松方程的并行迭代算法。 本文使用有限差分法结合区域分解法对
本文在深入分析研究WebGIS应用系统现状和Struts框架机理的基础上,针对众多的WebGIS应用系统难以将表示层与业务层分离的问题,提出了在Struts框架下进行WebGIS应用系统的设计与
生产管理是中小制造业资源计划的关键子系统之一,在制造业信息化建设中处于十分重要的地位。它也是目前制造业信息化建设过程中的难点和薄弱环节。针对中小制造业生产管理过
在移动互联网日益兴起的今天,用户每天产生海量的带有地理位置和时间戳的文本数据。这些数据以前所未有的规模涌向用户。在这种情况下,用户希望在一个时间范围内,系统能够给
基于几何特征的物体识别方法是解决视觉模式识别问题的根本性出路,其中轮廓特征是最重要的几何线索之一。生物视皮层能够获取片段性的边缘信息,如何将它们组合成更长、更完整的
随着internet技术的发展和计算机应用的深化,目前基于internet的应用软件复杂度越来越高,而且对软件的安全性、可依赖性及可扩展性的要求也越来越高。这使得软件的开发周期必然
随着传统媒体市场与网络服务越来越紧密的融合,流媒体传播和使用日益广泛。特别是近几年来,网络的普及以及网络带宽的增加,使得流媒体商业应用市场也不断扩大,这就引发了流媒体及
医疗信息整合(IHE),是针对复杂而异构的医院环境,基于医疗标准的一种通用的医疗信息系统集成的新规范。本文基于Petri网理论,利用工作流技术,将IHE规范作为医疗信息系统集成问题
学位
数据仓库是在企业管理和决策中面向主题的、动态集成的数据集合。利用数据仓库技术实现对控制系统采集到的实时信息进行管理和分析是今后流程型企业实施管控一体化的必然道路
视频运动物体的提取是计算机图形学、计算机视觉中的一个研究热点,具有广泛的应用价值。运动物体提取的主要任务是,将一段视频中的运动物体与其所处的场景相分离。通过视频融