聚类分析在图像分类中的应用研究

来源 :内蒙古科技大学 | 被引量 : 0次 | 上传用户:guobihuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
到目前为止,图像的分类识别依然是图像处理领域中的难点。因为现实世界是多样的和复杂的,获取图像的途径也是多种多样的,这就使得不同的图像相互之间差别很大,难以用统一的方法和模型描述。论文中将数据挖掘中的聚类分析方法应用到图像分类中。首先对基于密度和密度可达聚类算法(Clustering Algorithm Based on Density and Density reachable,CADD)进行了深入分析并进行了大量的实验验证,就CADD算法在大型图像数据集中应用暴露出来的不足做了四点改进。(1)重写了“计算并保存相异度矩阵”的代码,主要是为了降低保存相异度矩阵所占用的内存空间。(2)新程序引入了一个新的参数——簇个数阈值。(3)为了使原CADD算法能够更有效地处理变密度噪声和孤立点,改进了原有密度可达距离的计算方法。(4)新增了一种数据对象相似度度量的计算方法——余弦相似度方法。其次将改进了的CADD算法与传统的聚类算法K-means和层次聚类算法在真彩色BMP位图的分类中的实验结果作了对比分析。得出的结论是:(1)改进了的CADD算法与K-means和层次聚类算法相比,具有较高聚类精度、分辨率。(2)尽管在聚类过程中CADD算法也需要输入初始参数:密度参数σ和初始密度可达距离调节系数coefR,但实验研究表明,密度参数σ的变化对聚类结果影响不大;根据其定义,初始密度可达距离调节系数coefR(0<coefR<1)的选择取决于聚类精度,对领域知识的依赖性小。(3)由于在聚类过程中采用了自适应密度可达距离,通过自动调整聚类簇的密度可达距离使算法能够划分出变密度的簇和噪声点(孤立点),改进了聚类效果。(4)图像分类需要考虑的另一重要方面是聚类算法的空间复杂度和数据处理能力,因为图像的数据量是巨大的。我们在设计算法模型时考虑了这方面的重要性,利用像素点的平均采样提高了算法的效率。
其他文献
本文以采用集中监控、分散控制多电机方案的国防某实验基地弹目空间交会模拟平台控制系统为基础,运用嵌入式系统方案设计了其主控制器,并通过设计的ZigBee无线协调器加入无线
随着金融证券管理、Internet流量监控、Web使用日志等新型应用领域对数据的管理与分析提出了新的要求,数据流及其相关技术已经成为当前数据处理领域的研究热点之一。由于XML
仿真训练装置原是燕山仿真中心1994年建成的培训技术人员和操作工人培训装置,其工艺流程是以某二甲苯装置中异构化反应的分离工段为参照对象,结合仿真实现的实际需要而设计的。
本论文涉及的科研课题来源于延安天然气输配工程(二期),论述了其中最重要的门站控制系统工程设计过程,研究和解决了关键技术问题。文章首先介绍了天然气输配工程的工艺特点,
本论文在全面研究股票市场及其问题的基础上,把股票的小波神经网络预测方法与ARMA时间序列预测方法用贝叶斯组合理论相结合,构造出一个综合且准确率较高的股票组合预测模型,
工业生产的过程监控一直是流程工业系统关注的主要问题之一。它通过监测生产过程的运行状态,及时检测故障发生、过程干扰以及其它的异常工况,定位并诊断引发故障的原因变量,
本文从无线通信技术在表决系统中的应用出发,学习了一种新的无线通信技术标准——ZigBee。ZigBee技术是在IEEE802.15.4标准上提出的,IEEE802.15.4规范是一种经济、高效、低数据
目前,国内很多钢铁企业为了提高生产效率,对其企业综合自动化信息系统提出了更高的要求。然而,不少企业的过程自动化系统并不完善,制约了其企业综合自动化信息系统的建设,受
学位
强化学习是人工智能中策略学习的一种,是一种重要的机器学习方法,用于解决可感知环境的自主agent,如何学习选择出实现其目标的最优行为策略。由于强化学习通过与环境的直接交互
大型火力发电厂的协调控制系统是一个典型的非线性、时变、多变量的控制系统。当前,国内外控制界都把复杂系统的控制作为控制科学与工程学科发展的前沿研究方向。本文主要研