基于可能性模糊聚类的离群点检测算法研究

来源 :河南理工大学 | 被引量 : 0次 | 上传用户:mmghb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
离群点是分布规律明显异于主流数据的极少部分数据,其中常常蕴含着事物的变化趋势,因而不能简单地等同于噪声。离群点检测算法为数众多,其中基于聚类的方法比较直观,将明显偏离各簇的数据对象或者数据对象数目明显少于其他簇的簇分别定义为离群点和离群簇。聚类算法的研究较为成熟,基于聚类的离群点检测算法可以为离群点检测研究提供坚实的理论基础。本文首先分析各种离群点检测算法的优缺点,其中基于聚类的离群点检测算法更加直观高效,该类算法的研究重点在于聚类算法的研究,随后从聚类思想、聚类目标函数以及算法流程等方面对模糊聚类及其改进算法进行介绍。本文重点对模糊联合聚类、可能性聚类以及模糊三维聚类的特点进行深入研究,对其中存在的一些不足,提出改进方案。主要工作如下:(1)针对模糊联合聚类对噪声敏感以及可能性聚类容易出现一致性聚类问题,本文提出一种混合聚类算法。在模糊联合聚类的基础上加入样本典型性隶属度使其扩展成为可能性模糊联合聚类,同时使用互信息损失评价样本间的相关性,该算法可以有效识别离群点,并降低离群点对聚类精度的影响,而且对参数的敏感度较低。(2)模糊联合聚类属于二维聚类算法,为了能够对三维列联表进行有效的离群点检测,本文提出一种基于信息瓶颈的模糊三维聚类算法。该算法把模糊联合聚类处理二维列联表的思想扩展到三维,并且采用信息瓶颈距离作为距离公式。该算法在聚类过程中可以同时从三个维度上对数据进行聚类,同时强调相似性度量在聚类过程中的重要性,与现有的联合聚类算法相比能取得更高的聚类精度,为三维数据中的离群点检测提供了理论依据。
其他文献
目的早期胃癌(early gastric cancer,EGC)是指局限于粘膜层(T1a)或粘膜下层(T1b)的肿瘤。目前有限的研究探讨粘膜内癌(T1a EGC)和粘膜下癌(T1b EGC)的临床病理特征和预后。因此,本研究旨在探讨两组患者在淋巴结转移(lymph node metastasis,LNM)和预后方面的差异,以及确定影响LNM和预后的危险因素,为EGC的最佳治疗和术后随访提供依据。方
顾客对质量的要求伴随着社会的进步、经济和技术的快速发展而不断提升,使得质量的概念也伴随着时代的发展而不断的深化和演变,质量所涉及的范围和对象越加的丰富和广阔,质量
水环境中过量锑(Sb)所引起的环境污染受到越来越多关注。生物吸附除锑具有成本低、环境友好、吸附后重金属易回收等优点,近年来涌现出一系列关于生物吸附剂的研究报道,但这些生物吸附剂存在吸附容量低的缺陷,且铁盐改性杆菌吸附除锑的研究未见报道。因此,本研究围绕课题组前期从锑污染土壤中筛选获得的卡氏变形杆菌(Proteus cibarius DSHN0704)的氧化性及差异基因表达、优化培育及铁盐改性生物吸
炸药爆炸所产生的高温、高压气体在爆破介质破裂瞬间冲入大气,迅猛压缩邻近空气,形成空气冲击波。空气冲击波会对周围目标物产生不同程度作用与影响,甚至是破坏和损伤。井巷与隧道爆破作业时,由于受到限制空间的影响,爆破空气冲击波持续时间增长、峰值压力衰减变缓,对作业空间内人员与设备安全构成极大威胁。因此,针对限制空间条件下的爆破空气冲击波传播特性开展研究,并基于传播规律确定人员、设备的安全区域与安全距离,制
通过使用调和分析中的常用估计方法---Sharp极大估计法,对两类奇异积分算子与Campanato函数构成的交换子分别进行加权估计。各章具体安排如下:第一章:叙述了Campanato函数与
MicroRNAs(MiRNAs)是一类微小的内源性非编码RNA。近年来,许多研究表明miRNA的突变和调控异常会导致许多疾病,miRNA可以在疾病的诊断和治疗等过程中充当重要的生物标记物。早
近年来,全球范围内H5亚型高致病性禽流感(HPAI)暴发频率变得更高,NA亚型呈现多样性。我国从家禽和野鸟体内亦分离到与多种NA亚型组合的H5亚型高致病性禽流感病毒(HPAIV),并以
光学方法是研究固-液接触时动态润湿效应的重要研究技术。动态接触角是固-液接触时主要的物理参数,也可反映固-液接触时的润湿程度。实验中主要通过光在液体弯曲液面上的反射
菠萝蜜(Artocarpus heterophyllus Lam.)是桑科(Moraceae)木菠萝属(Artocarpus)热带亚热带著名常绿果树,又称木菠萝、蜜冬瓜、树菠萝、大树菠萝等,属于南方特色经济树种之一。菠萝蜜原产于印度南部,后引入中国,目前在菲律宾、印度、孟加拉国等热带、亚热带国家均有不同程度的栽培。菠萝蜜果锈病的爆发,对菠萝蜜产业造成了一定的经济损失。本研究针对菠萝蜜果锈病进行了病
随着燃煤电厂烟气中汞污染物排放控制的要求越来越高,对烟气中各形态汞浓度准确、实时地监控显得尤为重要。基于冷蒸气原子荧光光谱法(CVAFS)的在线监测方法将以其操作简单、