基于模糊聚类分析的数据异常知识发现方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ineedtoxiazai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,计算机技术得到了迅猛的发展,相应的,也带动了数据库领域和信息技术领域相关技术的飞快升级。数据挖掘技术被广泛的应用于天气预报、疾病分析、信用卡欺诈分析、股票市场分析等各个领域之中。虽然传统的异常点检测方法已经可以完成大多数数据集的检测任务,但是有些时候,传统的异常点检测方法考虑的方面可能不全,这就会影响异常点检测的效果和精度。模糊c-均值聚类(简称FCM)算法与其他的聚类算法类似,具有一定的数据聚类能力,但是在利用FCM算法进行数据聚类时,会存在一个不可避免的问题,异常数据应与其一个范围之内邻域数据的分布相关,但这种算法却没有考虑邻域的影响。本文通过对FCM算法的目标函数进行改进,得到了一种考虑了邻域因素的邻域-模糊c-均值算法(简称NFCM),并分别应用改进前后的算法对数据集进行分类。局部离群因子(简称LOF)算法是一种已经十分完善的基于密度的离群点检测方法,但其仍然存在上述没有考虑邻域影响的缺点,本文中将对基于密度的LOF算法进行改进,对数据集进行分类后,根据数据对象的分类情况,通过改进其可达距离和可达密度的形式,得到考虑了邻域对检测结果影响的模糊-LOF算法(简称NFu-LOF),并分别应用改进前后的算法对数据集进行检测和分析。本文中选取四个数据集,首先分别应用模糊c-均值(FCM)算法、改进的邻域模糊c-均值(简称NFCM)算法对这四个数据集进行数值试验,通过数值试验的结果对比分析改进后的邻域模糊c-均值(简称NFCM)算法的召回性和优越性。然后将分别应用LOF算法、改进的模糊LOF算法对其中两个数据集进行数值试验,通过数值试验的结果对比分析改进后的模糊-LOF算法的准确性和优越性。
其他文献
博弈逻辑是博弈论与逻辑学相交叉的一门崭新的学科,它属于行动逻辑。博弈逻辑研究理性人在互动中的推理问题,局中人在进行预决策推理、自己得益最大化时往往会受到自身认知能
当前,园林绿化市场竞争异常激烈,企业要在激烈的市场竞争中生存求发展,就必须向用户提供质量好、造价和工期合理的新产品,而生产一个优良产品,除了设计、材料供应等因素之外,更要靠
期刊
随着科学技术的发展,非线性最优化方法在科学计算和工程分析中起着越来越重要的作用,它们的实现大多依赖目标函数的一阶或高阶导数及其相关项(如雅可比矩阵与向量的乘积等)的
本文主要运用微分不等式的技巧(或称为上下解方法),在一定条件下证明几类非线性微分方程(不带小参数)解的存在性(部分内容包括解的唯一性),在此基础上研究带有小参数的几类奇异
随着水平井长度的增加,水平井与油藏的接触面积相应也增加,这可以获得较高的采收率和较大的采油速度。但井筒中的流动阻力也相应增加,这对井的生产率有直接的负面影响,同时水
任何传媒规制体系都不是单一的,而是一个由法定规制和替代性规制构成的连续体。替代性规制具有灵活性强、反应及时、集中行业专家智慧、规制成本低等优势,与法定规制形成优势
本文基于非线性弹性力学的有限变形理论,将不可压缩超弹性材料组成的球形结构(如实心球体、初始状态含有微孔的球体、球壳)内部的空穴生成和增长问题归结为一类非线性常微分方
自多分辨分析的概念问世之后,小波分析及其应用得到了蓬勃发展,其涉及面之宽广,影响之深远,发展之迅速都是空前的。小波的优势本质上源于它兼具光滑性和局部紧支撑性质,从而能够比
随着新课程教育改革的推进,以往传统的教学观念和教学模式受到了巨大的冲击和挑战,在革新式的素质教育面前,作为高中数学教师,应立足于“促进每个学生的身心发展,培养其终身学习的
建筑工程施工管理的目的就是为了从准备施工到施工过程再到最后的工程验收的一系列过程中,如何更有效更安全的完成整个工程,如何更好地解决在这个过程中遇到的问题,就必须做好建
期刊