基于累积全熵的子空间聚类离群点检测算法

来源 :计算机集成制造系统 | 被引量 : 0次 | 上传用户:MUWANG
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对累积互信息方法存在的最佳聚类子空间选择不稳定和计算复杂的问题,给出累积熵的链式法则、累积全相关、累积全熵的计算方法,采用累积全熵在连续数据集上挖掘最佳聚类子空间,并在最佳聚类子空间中进行离群点挖掘,提出基于累积全熵的子空间聚类离群点检测算法。分别在真实数据集和虚拟数据集上验证了所提算法的有效性和可伸缩性。实验表明,所提算法进一步提高了子空间离群点的挖掘效率。
其他文献
利用2005年在北京昌平区小汤山开展的非均匀下垫面观测实验的观测数据,分别处理了涡旋相关法和大孔径闪烁仪LAS测得的感热通量,并运用印痕模型对数据进行“源区”分析。分析
本文从鲁迅研究家陈涌的《论鲁迅小说的现实主义》一文的政治时代意义视野分析,从陈涌发掘到的鲁迅小说《呐喊》《彷徨》现实主义的表现、《论鲁迅小说的现实主义》的积极意义
在B2C环境下,动态定价是网络零售商解决配送时隙能力不足的重要手段。以网络零售商期望收益最大化为目标,根据客户在线时隙选择随机性的特点,建立了基于Logit模型的选择概率
本试验采用秋水仙素浸根法及涂沫法研究辣椒染色体加倍技术.结果表明:秋水仙素浸根法浓度在0.05%~0.4%,浸根时间24 h(小时)或48 h(小时)均可获得染色体加倍;涂抹法未能获得加
为了提高设备的协同作业能力,基于采用双40岸桥和边装边卸工艺的集装箱作业系统,提炼出新的三阶段混合流水车间问题.其中,第一阶段和第三阶段有多台批处理机和非批处理机,第
疫病是甜(辣)椒生产上的一种毁灭性病害,在我国南方和北方都有分布.其病原为辣椒疫霉属(Phytophthora capsici Leonian),属于鞭毛菌亚门疫霉属[1].该病病原还可侵染西瓜、南
本文分析了2003~2005年半干旱区退化草地和农田下垫面近地层湍流通量日、季、年的变化特征,探讨了不同年份的气候背景和下垫面土地覆被对地气交换过程的影响。结果表明:半干旱
随着农村产业结构的调整,北方长日型洋葱栽培面积越来越大.我们开展洋葱引种试验研究多年,积累了一些经验,为了帮助农户种好洋葱,现简要介绍如下.
通过室内饲养美洲斑潜蝇,对其生物学特性以及防效进行了初步探索研究.在室内自然条件下,温度23℃~27℃,相对湿度37%~52%的条件下,美洲斑潜蝇的蛹期为6 d~7 d(天),成虫寿命为5 d~8
【中图分类号】G633.3 【文献标识码】A 【文章编号】2095-3089(2018)19-0160-02  当前,比较教学法的研究与实践在全世界流行,因为它是提高学生素质的一种好办法。  语文教学中比较法的运用随处可见。如议论文中正反对比论证,记叙文中的衬托对比描写、说明文中作比较的说明方法,修辞方法中的对比格、对偶格,以及形近字、反义词的比较区别等等。其显而易见的作用已成共识,但这仅仅是比较