基于模糊集和决策粗糙集的数据挖掘方法研究及其在图像分割上的应用

来源 :南京大学 | 被引量 : 0次 | 上传用户:zhengwwwchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊集(Fuzzy Sets)和粗糙集(Rough Sets)是数据挖掘中解决不精确性和不确定性问题的有效工具。由于在人们产生大量数据时,数据本身会具有不确定性,同时在人们所要解决的问题中会存在模糊性的概念,所以基于模糊集和粗糙集进行数据挖掘方法的研究是十分必要的。众所周知,粗糙集模型需要对连续型属性的数据进行必要的离散化处理,为此必将带来一定程度上的信息损失。结合模糊集理论和粗糙集模型的模糊粗糙集模型可以更好的处理具有连续型属性的数据。扩展了传统粗糙集模型的决策粗糙集(Decision-Theoretic Rough Sets,DTRS)模型更被广泛运用。因此如何结合模糊集理论和决策粗糙集模型对具有连续型属性的信息表进行属性约简和分类是值得研究的问题。作为模糊理论中的模糊聚类分析也受到广泛关注,尤其是用于图像分割的模糊C-均值(Fuzzy C-Means,FCM)聚类算法。FCM聚类算法是最小化加权误差平方和的迭代无监督聚类算法。FCM算法的软性划分特性真实地反映了图像像素归类时的模糊性和不确定性,从而使得其性能优于传统的硬聚类方法。但是FCM算法在做图像分割时仍存在着一些问题。一方面是聚类数及聚类中心难以确定,糟糕的初始数据会对FCM进行图像分割结果产生影响;另一方面是FCM算法对图像相邻像素间的空间信息缺乏利用,可能导致分割模型并不完整。本文分别针对上述的几个问题进行研究和改进,主要工作如下:引入模糊隶属度函数来改变计算DTRS模型中代价损失函数中的条件概率计算方法,得到模糊决策粗糙集模型(Fuzzy DTRS,FDTRS)。基于新的模型,进行属性模糊化处理、约简以及根据决策进行分类。实验表明,该方法是行之有效的。在利用FCM算法进行图像分割之前,我们提出用扩展的决策粗糙集模型(DTRS)做聚类有效性分析。这样可以确定最佳聚类数目和聚类中心,从而避免遇到在利用FCM算法时的盲目初始化问题。实验表明,该方法是行之有效的,并且比其他一些方法更具优势。我们提出结合FCM聚类和图割理论的图像分割方法。将图像预分割成超像素集合,其次用FCM算法进行图像分割,根据聚类结果和超像素邻域关系构建图模型,定义边的权值,从而达到充分利用图像的空间信息进行后续分割的目的。实验表明,该方法能够取得良好的分割效果。
其他文献
随着互联网的迅猛发展,它在人们的日常工作、生活和娱乐中都发挥着十分重要的作用。同时网络提供给人们的服务越来越多样化,特别是多媒体技术的大规模应用,同时网络用户的大幅度
目前被广泛采用的PKI技术(Public Key Infrastructure-公钥基础设施)是解决Internet上安全问题的一套完整的应用方案。它采用证书管理公钥,通过第三方的可信任机构一认证中心C
1982年,诺贝尔物理学奖得主理查德·费曼提出,量子计算机的计算速度远远超过经典计算机。20世纪90年代,Shor提出的量子素数因子分解算法以及Grover提出的量子搜索算法,证明了
近年来,伴随无线通信技术的快速发展,无线局域网得到了越来越多的应用。本论文研究基于IEEE802.11系列协议的无线局域网的性能改进机制。本文的主要贡献和创新点如下:   提出
学位
互联网的高速发展使其成为世界上资源最丰富的信息网络,其蕴涵的大量共享资源,已成为人类获得信息的重要途径之一。随之带来的信息安全问题也日益严重,这其中不仅包括计算机病毒
学位
伴随着互联网的发展,新闻搜索引擎已成为人们日常生活中获取新闻的一个重要方式。但目.前的新闻搜索引擎一般是面向全部的网民,在新闻源的选择上粒度较大,对特定区域内的新闻搜集
电子政务的建设快速发展,迫切需要数据的交换与整合,尤其是位于不同物理地点的网间的数据交换。而由于不同系统运行的软硬件环境不同,实现技术也不尽相同,从而构成了一个巨大而复
在普适计算环境下,应用程序可以通过传感器来获取的环境上下文信息,并以此自动调整自身行为,为用户提供个性化服务。然而,由于传感器误差以及数据传输失效等因素,上下文信息
本文对基于本体的商品评论分类器的设计与实现进行了探讨,提出了基于本体的商品评论分类方法。针对手机商品评论领域,引入了手机评论知识组织结构。手机评论知识组织结构是基于