连续数据上基于贝叶斯网的子空间例外检测

来源 :云南大学 | 被引量 : 0次 | 上传用户:ydaf2ut9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近年来信息产业界讨论和研究的一个热点。由于当代计算机技术尤其是数据库技术的飞速发展,人类面对史无前例的海量数据,因此迫切需要将这些数据转换成有用的信息和知识,并将这些信息和知识运用于各种应用中。其中例外检测就是其重要分支之一,例外检测往往可以使人们发现一些既真实而又出乎意料的知识。有些研究把例外数据当成噪声、污染,想通过忽略这些例外数据来提高数据的质量,但是有些有用的信息,重要的知识,恰恰被忽略掉了,因为这些例外数据表示了一种偏差或新的模式的开始。   例外检测是数据挖掘领域的热点之一。例外数据检测,是许多应用领域工作的基础和前提。通过对例外数据的偏差分析,能发现新的知识,新的模式。例外数据检测具有特殊的意义和很高的实用价值,如金融、通信领域的欺诈分析与监测、医疗分析、网络入侵监测、消费极高或极低客户的消费习惯、过程控制中的故障检测与诊断等。对例外数据的挖掘研究比对正常数据的挖掘研究更有意义。本文针对高维数据的稀疏性,提出了连续数据上基于贝叶斯网的子空间例外检测方法,该方法能有效识别子空间上的例外点。   本文主要内容由以下几部分组成:   首先,介绍了例外检测及贝叶斯网的相关知识,分析了现有例外检测算法的优点和不足。   其次,定义了子空间例外的概念,分析了贝叶斯网和子空间的关系,介绍了利用贝叶斯网检测子空间例外的方法;   然后,针对连续属性数据,贝叶斯网中参数太分散的不足,对连续属性进行离散化。   最后,在UCI数据集上进行实验验证。  
其他文献
在网络技术和网络应用飞速发展的今天,网络管理方法和技术显得越来越重要。网络管理作为网络技术研究的重要领域,它使得各通信网络能够稳定、高效、持续地运转,为社会生产和生活
随着互联网技术的发展,信息隐藏作为网络环境中一种新的保密通信手段,其应用得到迅速发展。然而,信息隐藏技术既可被国家用于安全、可靠地传送机密信息,也可被犯罪分子用于计划和
人形机器人是一种集环境感知、动态决策与规划、行为控制与执行等多项功能于一体的高智能机器系统。用于人型机器人的机器视觉研究涉及图像实时处理技术,计算机视觉传感器技术
随着教育体制改革的不断深化,我国的教学管理模式逐渐从学年制向学分制过渡。为了顺应时代的要求,我校远程与继续教育学院开始考虑引进学分制,而我校现行的远程教学系统采用学年
空间数据是各种地理信息的基础,地理空间数据库管理是GIS中最重要的功能之一,随着我国测绘事业的发展,拥有一款具有自主版权、支持军方产品标准和数据格式、安全可靠、功能强大
基于互联网的社交网络正在成为人类社会中社会关系维系和信息传播的重要渠道和载体,能够迅速形成社会舆论,对国家安全和社会发展都会产生深远的影响。对社交网络舆情进行实时
随着生活水平的提高,车辆逐渐成为人们生活中不可或缺的一部分,与此同时,人们对行车过程中的舒适度和智能度也有了更高的要求。本文通过提供车内基于位置的服务,对车内不同位置的
相对于C/S或B/S网络架构,P2P每个节点既可是客户端,又可以是服务器端,这种结构使得P2P在资源共享、协同工作、深度搜索和电子商务领域得到成功的应用。然而,P2P先天的开放、匿名
从产生的那一天起,GIS系统的开发经历了两次操作系统平台的迁移。早期的GIS系统都是基于Unix平台的桌面架构,随着上世纪九十年代初Windows操作系统的普及,那些成功的将软件迁移
异常检测是数据挖掘领域的研究方向之一。最初在对数据的统计分析中,样本数据中存在一些数据点,它们很明显地偏离大多数样本数据的分布区域,这些点被称为例外。例外数据可能是由