基于决策粗糙集的面向知识自动聚类及应用研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:aaa939639017
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是智能信息处理、数据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有重要作用。大多数聚类算法都需要预先给出参数,如聚类数目、聚类中心点或迭代次数等。事实上,如果没有相关知识和经验,这在多数情况下是不可行的。因此,为了减少人为干扰因素,本文基于决策粗糙集模型进行了自动聚类的研究。   Hirano和Tsumoto等提出的面向知识(Knowledge-Oriented)聚类算法,通过结合层次聚类算法和粗糙集理论,能从局部和全局的数据特性上对数据进行聚类,具有很好的聚类效果。因此,本文采用了面向知识聚类的算法框架进行自动聚类的研究。首先,针对面向知识聚类算法的初始聚类结果对用户输入的初始阈值参数敏感这一问题,本文提出了一种自动阈值选取方法--选择差值法。该方法充分考虑了数据的物理特性,能自动地得到较好的初始聚类结果。此外,本文研究发现了以往文献中定义的类类不可区分度公式的不合理性并进行了改进,新的计算方法使聚类结果更加准确。   本文还对决策粗糙集模型进行了研究,提出了基于决策粗糙集的聚类模式代价评估方法,能够动态的对聚类结果进行评估,根据聚类模式的代价值的变化来制定合并策略和指导算法选择终止点;另外,新方法也自动地给出了类重叠边界区域的范围,有助于用户选择不同粒度的聚类结果。   同时,本文给出了一个基于决策粗糙集的面向知识自动聚类算法,在人工数据集和标准数据集上的实验结果表明该算法是有效可行的,并且能处理类类边界重叠问题,也不需要人为阈值的设定。   最后,本文将上述研究成果应用到了Web搜索结果聚类中,仿真实验表明新方法在边界具有重叠现象的聚类中应用良好。
其他文献
数据挖掘技术能发现数据之间的潜在关系,从而提供决策支持,因此是数据库研究中极具应用前景的领域。关联规则是数据挖掘的重要工具之一,序列模式挖掘是对关联规则的进一步推广。
随着SOA的发展应用,网络上有越来越多的跨平台甚至跨语言的服务,当用户提出服务请求后,如何根据请求快速自动发现分布在Web上的相关服务,这就是研究的动机所在。   现有的服务
随着网络普及与发展,数字产品的共享变得越来越容易和频繁,多媒体作品的版权保护问题已经迫在眉睫,数字水印技术作为数字产品版权保护的主要手段,对其进行研究的必要性也越来
互联网的飞速发展在方便社会的同时,也带来了一系列的网络隐患。针对软件系统稳定性和安全性的问题,本文基于软件网络系统节点之间的调用关系、调用顺序以及内在的调用次数,
0-1背包问题是一种经典的NP难问题,目前还无法找到线性时间内求解该问题的算法,由于求解0-1背包问题在优化组合、资本预算、货物装载、削减库存以及信息密码学等领域具有极为重
目标跟踪是计算机视觉研究中的一个重要课题,它是目标行为理解的基础,是图像系统连续准确工作的重要部分。跟踪算法要求准确性和鲁棒性,在很多应用下还要求实时性,而现实中目
随着经济的快速发展和人们生活水平的不断提高,我国机动车的数量也在急速增多,机动车在给人们生活带来便利的同时,其造成的道路交通问题也日趋严重。因此,对于道路交通的管理急需
本文针对机器学习在视频水印中的应用进行了研究,主要是支持向量机与集成学习在其中的应用,首先通过对视频水印常遭受的攻击进行分类,然后根据每一类给出了应有的防范方法,重
设计模式是软件设计中典型问题的经典解决方式,但是其具体实现方式丰富多样。从源程序中识别出设计模式的实例,并提取出其语法和语义方面的详细信息,将对软件的理解和维护有很大
随着移动计算、普适计算和Web Service等新兴技术的迅速发展,尤其是在Internet成为主流的软件开发环境后,动态软件架构(DynamicSoftware Architecture,DSA)的研究已引起了研究者