【摘 要】
:
异常点检测作为数据挖掘的一部分,在金融、电信、商业、医疗、互联网以及工业等领域都有着广泛的应用。异常点检测在大数据时代背景下,是数据挖掘不可或缺的重要内容之一。鉴
论文部分内容阅读
异常点检测作为数据挖掘的一部分,在金融、电信、商业、医疗、互联网以及工业等领域都有着广泛的应用。异常点检测在大数据时代背景下,是数据挖掘不可或缺的重要内容之一。鉴于异常点检测在数据分析中的重要性,以及其广泛应用,本文提出了一种带有季节调整的鲸鱼算法优化的支持向量回归机算法对单变量时间序列进行异常点检测。首先用季节调整剔除时间序列的周期,对剔除周期后的时间序列采用滑动窗口的办法来划定时间段,采用交叉验证的方法确定最优的时间段的长度。接着通过鲸鱼算法优化的支持向量回归机算法来预测时间序列,最后根据预测值与模型的残差确定置信区间。如果当前的数据落在置信区间内,则该数据被判定为正常值;如果当前的数据落在置信区间之外,则该数据被判定为异常点。本文提出的方法一方面能够很好的避免将时间序列中本来较高的波峰或较低的波谷判定为异常点,另一方面对于时间序列中波动比较明显的异常点的检测也有很好的效果。通过仿真数据、兰州市空气质量指数数据、比利时蒙斯市附近家庭用电数据以及中国北京、上海、天津和重庆四城市肺结核发病率数据共四组数据,将本文提出的方法与常用的几种异常点检测方法在这四组数据上进行了实证研究并进行了比较。从四组数据最终的结果来看,本文提出的方法在异常点检测这个领域有较为理想的效果。
其他文献
作为一种研究阅读过程的方法,由于移动窗口方法具有许多优点,它已被研究者广为使用。本文介绍了移动窗口方法的基本假设以及实现过程,简要介绍了其它几种窗口方法,探讨了这一方面
在人类对自然的改造中较为常见的边坡地质灾害主要包括工程崩落、滑坡等等。对于边坡地质灾害,如果不能采取有效措施及时防护,则会造成更加严重的灾害问题。对此,本文首先介
日粮中的n-3PUFA具有多种作用,除了调节质膜组成和影响细胞信号之外,同时还涉及多种与脂代谢有关酶与蛋白的基因表达,如:PPARa、SREBPs、LXR等,通过它们来影响靶基因(如:ACO—A、FAS
学术信息主题网关将特定主题领域的信息资源、工具与服务集成到一个整体中,为科研用户提供一个方便的信息检索、浏览和服务入口。通过设计了EXCELLENCE主题网关模型,将EXCELLEN
论文首先介绍了全文检索的概念和发展现状,对SQLServer关系数据库的全文检索机制作了重.最分析。然后结合简单示例,详细阐述了如何利用SQLServer2005数据库创建全文目录、生成全
Soil organic carbon (SOC) is the percentage measure of carbon (C) derived from living organisms in soil. Stability of soil organic matter (SOM) can be defined i
目的:建立用于静脉注射用人免疫球蛋白(IVIG)的细菌内毒素检查方法.方法:通过干扰评价实验证明IVIG对细菌内毒素检查法有强烈的抑制作用,单纯用简单稀释和调整pH值法无法消除
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
利用三色荧光标记的A、C、T双脱氧核苷酸单碱基延伸的方法结合编码寡核苷酸芯片技术检测单核苷酸多态性(SNP)的基因型.以beta地中海贫血样本基因(HBB基因)突变作为模型的研究
针对目前国外开源OPAC系统在我国应用过程中所遇到的一些问题,根据国内的实际使用环境,设计了一个基于Solr的开放与交互式OPAC—COOPAC系统,COOPAC系统基本解决了国外开源OPAC系