相容粒计算模型及其数据挖掘研究

被引量 : 6次 | 上传用户:tonze5082
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粒计算是人工智能领域中的一种新理念和新方法,在数据挖掘中凸显出了极大的优势,主要用于解决海量数据的挖掘和复杂问题的求解。由于经典粗糙集理论受限于等价关系,很难得到满足,难以应用和进一步推广。其中,去掉传递性限制的相容关系对论域的分类一般不能形成论域上的划分而是论域上的覆盖,而这种扩展一般是基于不完备信息系统提出的。本文通过把邻域定义为粒,将知识抽象成论域上的导出划分,由于此导出划分满足等价关系,避免了对问题的具体描述的限制。建立相容粒计算模型,研究如何进行知识粒化、如何进行基于粒的计算以及分类和聚类等粒计算范畴的问题,主要研究工作如下:(1)从集合论的角度,提出了相容粒计算模型和基于邻域系统的上下近似的概念定义,讨论并证明了新定义下粗糙集的相关性质及分类近似的度量。提出了相容知识库和相容信息表的一一对应关系,将Pawlak的完全定理扩展为通用完全定理,并给予了证明。研究了不完备信息系统的粒计算问题,给出了相容信息表的属性约简方法,提出了邻域依赖约束和中心依赖约束的决策系统的规则归纳算法,通过实例说明了算法更具一般性。(2)提出了一种基于粒化的符号表示方法,将信息粒化引入时间序列分析。通过对时间序列分段,计算每段粒化的相似度,为每一段构建信息粒,将谱聚类运用到各段之间相似度矩阵的构造中,实现段的聚类,获得粒的标签。通过在UCR时间序列数据挖掘库中的四个数据集上进行实验,结果表明提出的粒化方法能非常好的运用到隐马尔科夫模型对时间序列建模中,且将提出的半监督方法与监督的方法及自主训练学习方法进行了比较,说明该半监督方法能在较少标记数据的情况下构造更为准确的分类器。(3)提出了基于粗糙K均值聚类的改进线性标签传递算法。通过分析数据的大致分布情况,依据数据是否位于同一簇的上近似或下近似中,得到除数据之间距离以外的更多的信息,在构造图的时候,可以利用这些信息来选择其邻居,用于标签的传递。在UCI数据集上的实验结果显示出其分类的准确率得到了一定的提高。
其他文献
现实世界数据集合的规模正在飞速膨胀。挖掘隐藏在数据内部的、模式化的信息或知识,变得日益重要。这使得数据挖掘成为了一个热门的研究问题。数据挖掘技术日趋成熟,研究发现数
随着经济的发展和文化事业的不断进步,人们对于舞台演出的质量有了越来越高的要求,舞台技术也得到了快速发展。现代舞台系统的特点是控制对象多、方式灵活、安全可靠性高。多电
每种新传播技术及方式的出现,均会引起音乐的创新与变革,且在一定程度上,传播媒介会对音乐的发展产生影响。虽然音乐自身的属性会对音乐传播产生影响,但是在当前社会中,音乐传播已
近年来,微光纤的发展受到了研究人员的广泛关注,并迅速成为了大家研究的热点。在不同的结构、尺寸、材料体系下,微光纤将产生不同波段的各种新颖效应。本论文主要基于微光纤
在改革开放多年后的今天,已完成了由计划经济向市场经济转化的过程。科学技术的快速发展,让我们的生活发生了天翻地覆的变化。国外各种思想也快速地涌入国内,在改变了我们的
基底动脉尖综合征(top of the basilar artery syndrome,TOBS)是缺血性脑血管病的一种特殊类型,1980年由Capland[1]首先进行了报道。基底动脉尖端分出大脑后动脉和小脑上动脉两
关于东平“汉光禄勋刘曜碑”的著录,可分为两个阶段。第一阶段是宋代。自欧阳修《集古录》至洪适《隶释》,此时的刘曜碑碑额、碑阴俱在,虽文字磨灭严重,但尚可识别--百余字;第二阶
基于现场观察到的国内某特大跨度悬索桥吊索的风致振动现象,定性分析排除了尾流驰振、涡激共振及风雨激振。理论论述、数值模拟和简化风洞试验依次证明这是一种主缆抖振引起
悬架系统设计一直是汽车设计中非常重要的一部分,对车辆的整体性能有着极其重要的影响。主动悬架一直以来都是汽车研究者比较青睐的研究领域。好的主动悬架控制策略可以显著提
随着我国社会经济的发展,我国高速公路建设需求量逐渐增加,高速公路建设质量也受到更多的重视。高速公路路基施工质量关系到整体道路的建设质量,路基施工技术是高速公路建设