不确定数据聚类分类研究

来源 :大连理工大学 | 被引量 : 3次 | 上传用户:ljsamuel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统聚类分类算法需要待处理的数据是确定的。然而,现实应用中由于设备测量误差、网络传输干扰、用户隐私保护等原因,获得的数据普遍存在不确定性。由于不确定性的引入,传统聚类分类算法无法对不确定数据直接进行处理,难以满足现实应用要求。因此,针对不确定数据设计专门的聚类分类算法显得尤为重要。本文围绕不确定数据聚类分类问题展开研究,旨在为不确定数据提供有效的聚类分类算法。主要贡献如下:
  (1)基于自适应混合距离测度的不确定数据聚类。针对不确定数据聚类中几何距离测度不能识别位置严重重叠且概率分布不同的不确定数据,概率分布距离测度不能识别不同对完全分离的不确定数据的问题,本文提出一种自适应的混合距离测度。通过同时考虑几何距离和概率分布距离,并根据数据集的位置重叠信息自适应地调节不同距离测度的重要性,该距离测度可以避免现有距离测度的问题,提升不确定数据的聚类效果。
  (2)基于密度及层次密度的不确定数据聚类。针对基于密度及层次密度的不确定数据聚类中不确定信息丢失,计算复杂度高,固定概率阈值的问题,本文提出新的基于密度及层次密度的不确定数据聚类算法。通过使用精确的方法计算不确定数据点之间距离小于等于某一阈值的概率,引入概率邻域,支持度,核心对象概率、直接可达概率、模糊核心距离、模糊可达距离等一系列定义,提出的算法可以避免现有基于密度及层次密度的不确定数据聚类的问题,改善不确定数据的聚类效果。
  (3)基于可能世界的AdaBoost不确定数据分类。针对不确定数据分类算法依赖于理想概率分布,传统分类算法不能直接处理不确定数据的问题,本文提出基于可能世界的AdaBoost不确定数据分类算法。通过在多阶段引入可能世界、增加多数投票和加权投票过程,该算法能够处理任意分布的不确定数据,并且使得传统分类算法可以直接处理不确定数据,从而拓展了不确定数据分类的应用范围,提升了不确定数据的分类效果。
  (4)基于一致性学习的不确定数据聚类分类。针对现有不确定数据聚类分类算法忽视可能世界之间存在一致性的问题,首先,本文提出基于相似度矩阵一致性学习的不确定数据聚类分类框架。该框架利用一致性原则为不同可能世界学习一致的相似度矩阵来指导聚类分类过程,从而提升不确定数据的聚类分类效果。其次,针对边缘可能世界会对聚类结果造成负面影响的问题,本文提出代表可能世界的选取策略来过滤边缘可能世界,并将该策略与基于特征向量矩阵的一致性学习相结合,提出基于代表可能世界特征向量矩阵一致性学习的不确定数据聚类算法,从而提升了不确定数据的聚类效果。
其他文献
摘要:随着科学技术的进步,煤矿基本实现了综合机械化开采。在综合机械化开采中,需要许多先进的机电设备。然而,由于煤矿井下环境恶劣,机电设备会出现各种故障,严重影响煤矿的安全生产。因此,为了保证煤矿安全生产,有必要对设备故障进行快速维修。为了进一步提高设备故障诊断的效率,许多煤矿开始利用故障诊断技术来发现机电设备故障。论述了故障诊断技术的原理和优点,重点介绍了故障诊断技术在煤矿机电设备维修中的应用。关键词:故障诊断技术;煤矿机电;设备维护;使用分析1煤矿机电设备故障维修的重要性1.1提高煤矿设备的效率对于一个
期刊
目的:  研究铁皮石斛中性多糖对秀丽隐杆线虫寿命的影响及其分子机理。  方法:  水提法提取铁皮石斛多糖,除蛋白和小分子物质后,用DEAE-52纤维素阴离子交换色谱分离铁皮石斛多糖,得到铁皮石斛中性多糖。对铁皮石斛中性多糖进行GCP凝胶渗透色谱分析其分子量分布范围,并研究不同浓度铁皮石斛中性多糖对秀丽隐杆线虫寿命的影响及其分子机理。  结果如下:  (1)水提法提取铁皮石斛多糖,铁皮石斛材料的多糖
摘要:机械制造工艺能够去实行机械的合理化设计,而机械设计是制造工艺的参考,这两者是互相联系、互相影响的。本篇文章是从这两者相互影响的角度出发的,从而分析了制造工艺的流程以及合理化进行机械设计的原则,并且还给出了关于机械制造工艺中合理化机械设计的重点。关键词:机械制造工艺;合理化;机械设计前言:在对机械进行设计的时候,需要从事设计的人员根据标准化的原则来对机械中的每一项工作来进行设计,与此同时也还要把机械的使用性能参考进去,最后再实行不同的方法来满足它的实际性应用需求。为了实现提升机械制造工艺整体的质量以及
期刊
辐射传热是各种大型燃烧设备中的主要传热方式。炉膛内气体辐射介质的辐射能力随着本身浓度,温度以及压力行程的影响在气体光谱上发生复杂的变化,同时,随着近年来,空气分离/再循环烟气技术技术的发展,在富氧态下炉内烟气浓度,温度以及压力行程较之常规燃烧产生的变化对炉内辐射传热的影响不可忽视。本文选取相应的符合实际应用条件的模型,进行富氧态下气体参数的计算,比较和评估其受各个参数影响的能力。并改进和选取模型计
学位
本文利用常规查图法、逐线计算法和国内少用的窄谱带模型Leckner方法对CO2和H2O蒸汽混合气体的辐射特性进行了计算,表明Leckner方法能保证足够的精度,且该方法计算过程简便、易于在计算机上实现,并利用其计算分析了高CO2浓度烟气辐射特性变化特征。结合O2/CO2燃烧特点,建立了O2/CO2燃烧热力计算模型,并设计编制了相应的热力计算软件,将其应用于某1000t/h O2/CO2燃烧电站锅炉
学位
对高分子复合材料的阻燃改性技术进行探讨将有助于聚合物在功能化改性领域的研究,并加快火灾安全型阻燃高分子材料的研制开发。不仅可以带来经济效益而且具有很好的社会效益。研究开发洁净、高效的阻燃材料已成为科研人员的主要任务之一。聚丙烯(PP)是一种产量大、性能优异的通用塑料,具有优异的物理机械性能和良好的化学稳定性,但由于它属易燃材料,使其在电子、电器、交通、装饰材料等诸多领域中的应用受到很大限制。为拓宽
全球对温室气体的日益关注主要集中在如何有效控制CO2排放的问题上。作为一种有效控制CO2排放的O2/CO2燃烧技术是目前研究的热点。煤焦在O2/CO2气氛下的反应机理与在传统气氛下是不同的。这种不同造成了反应过程中煤焦颗粒物理/化学结构演化规律改变,反过来煤焦颗粒物理/化学结构演化规律改变也会影响反应过程。本文主要研究了煤在O2和CO2的混合气氛中反应时焦样的孔隙结构和表面官能团的演化特性。具体展
该文利用高速嵌入式AVR单片机进行远程心电监护系统的设计.该系统包括两大功能模块:便携式心电监护仪和医院中心监测站.心电监护仪能采集、存储心电信号,采用液晶显示器(LCD),可显示心电波形,也可通过电话将心电信号发送到定点医院监测中心.该监护仪既可作为患者的院外心脏保健设备,又可作为医生使用的便携式心电图检测仪.医院中心监测站采用了高性能的奔腾3计算机作为中心处理器,并且用虚拟仪器LABVIEW语
学位
该论文对智能控制的一个分支--仿人智能控制的算法进行了研究.将仿人智能控制算法与经典的PID调节器以及模糊控制方法相结合,对一个三阶时滞系统进行了仿真控制研究.仿真结果表明,用这种思想设计的控制器改善了单一控制方法的控制性能.在仔细分析仿人智能控制算法和PID控制器的基础之上,将二者结合,相互取长补短,使其算法与单一的PID控制器比较起来,在快速性、稳定性上有较明显的改善.该文还根据仿人智能控制算
随着网络和多媒体技术的发展,尤其是智能设备的广泛应用产生了大量的多媒体数据,其中图像和视频数据占有较大比例。数据规模的不断迅猛增长,致使现有的图像处理方法面临诸多挑战,如何有效地管理和利用这些数据成为学术界和工业界都比较关注的问题。基于内容的图像检索通过提取图像自身蕴含的视觉特征对图像进行查询,适用于大规模图像数据的管理和检索,是当前信息检索领域中的一项重要技术。  现有的基于内容的检索方法通常利
学位