基于密度的离群数据挖掘算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:wlszzj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是一个从大量数据中发现潜在知识的过程,其主要目的就是从大量的、不完全的、有噪声的应用中,提取隐含在其中的、人们事先不知道的、但又潜在有用的信息和知识。离群数据是明显偏离其它数据、不满足数据的一般模式或行为,与存在的其它数据不一致的数据。当前离群数据挖掘已应用于电信、金融、气象预报、股票市场、入侵检测等许多领域。离群数据挖掘包括了离群数据发现和离群数据分析两部分,离群数据分析与背景知识有关,本文着重讨论了离群数据挖掘中的最关键问题-离群数据的发现问题。本文通过研究不同的离群数据挖掘算法的特点,提出了改进的基于密度的离群数据挖掘算法,并将改进后的算法应用于网络入侵检测。具体来讲,本文的研究工作主要包括以下几个方面:①研究了离群数据挖掘的现状及过程、研究离群数据挖掘的意义、离群数据挖掘与数据仓库的关系。通过对知识发现一般过程的分析,给出了一个典型的离群数据挖掘系统的整体框架,分析了各模块的功能,并对其中采用的数据挖掘技术进行了详细的阐述。②全面研究了现有的离群数据挖掘算法,分析了常用的离群数据挖掘算法的优点和缺点、适用范围。③在现有基于密度的离群数据挖掘算法、DBSCAN算法和CURE算法的基础上,提出了改进的基于密度的离群数据挖掘算法,实验表明改进后的算法优越于原算法。④将改进后的算法应用于网络入侵检测,通过检测率和误报率两个方面对改进的算法进行了评估。⑤对离群数据挖掘未来的发展方向做了一下展望。本文通过实验来评估改进算法的性能,其实验数据来源于J?rg Sander的OPTICS算法的实验数据集和KDD CUP1999数据集。实验表明该算法具有很好的检测效果,总的来说,本文提出的算法在实验中取得了令人满意的效果。
其他文献
RFID技术即无线射频识别技术,是一种高效的数据采集和识别技术。广泛应用于物流、交通信息、医疗、零售等行业,可大幅度提高管理与运作效率、降低成本。随着RFID白皮书的正式发
目前,我国的高等教育己步入大众化,各高校能充分认识到教学质量是学校生存和发展的生命线。教师教学质量的标准尽管有一定的主观性,但仍有客观规律可循。为此,要建立一套教师
地理信息系统(GIS)是处理地理数据的输入、输出、管理、查询和分析的计算机系统,具有强大的空间分析功能,成为环境保护、交通、土地资源管理、规划、邮电、电力、军事、地学等
传统的Web应用程序执行速度较慢,交互也受到限制,尤其是和典型的桌面应用程序相比。为了获得新数据而不重新加载Web页面,虽然也曾经采用过一些方法,但这些技术都没有很好的被支持
学位
视觉运动分析是计算机视觉中的重要研究方向。光流场携带了有关物体运动和三维结构的丰富信息,因此对光流场的研究一直被视为是解决视觉运动分析的有效途径之一。光流法已经成
一个网站有许多个网页组成,网站上的信息分布在这些网页上,不同的用户对不同网页上的信息感兴趣,但是网站中大量的网页存在着结构的不合理性,链接页面的无效性等现状,降低了用户访
现代社会日新月异,信息化的浪潮汹涌而来,医院管理信息系统(HIS)的建设也日益受到关注,人们越来越认识到医院信息系统(HIS)将成为现代化医院必不可少的基础设施,它为提高医院服务
随着电子商务应用的不断扩大,个性化服务也得到越来越多的重视,大量的商务软件产品都声称支持个性化。电子商务推荐系统是智能信息服务的体现,它能够在了解用户的短期和长期
学位
随着教育体制的改革,提高全民素质,高校招生名额每年以30%的速度递增。而各个高校在原有的硬件,软件条件下,学生人数都不同程度的按比例增加,为了保证教学质量,最大程度的发挥软硬件