【摘 要】
:
为了提高局部异常检测算法的检测效率以及检测的准确度,提出基于Hadoop的分布式局部异常检测算法MR-DINFLO。该算法在INFLuenced Outlierness(INFLO)算法的基础上,引入了MapR
【机 构】
:
华北计算机系统工程研究所,中国信息安全研究院有限公司
【基金项目】
:
高分青年基金(CFZX04061502)
论文部分内容阅读
为了提高局部异常检测算法的检测效率以及检测的准确度,提出基于Hadoop的分布式局部异常检测算法MR-DINFLO。该算法在INFLuenced Outlierness(INFLO)算法的基础上,引入了MapReduce计算框架,将数据点的k近邻、k距离、反向k近邻、局部离群因子的计算并行化处理,从而提高了检测效率。算法在计算各个数据对象之间的距离时采用加权距离,通过引入信息熵来判断离群属性,给离群属性以较大的权重,从而提高了异常检测的准确度。实验在3节点Hadoop集群上进行,输入数据为KDD-CUP9
其他文献
抗日战争胜利后,共产党借地利之便,迅速控制了苏北,威胁国民党统治重心京沪地区。1946年春,苏北地区爆发了普遍的灾荒,民众掀起了清算地主的斗争,加之当时共产党激进的土地改
In this study, bioadhesive mini-matrices of natamycin were prepared for vaginal application by hot-melt extrusion. In addition, melt viscosity measurements, the
<正>2012年,姚丽雅工作室走进新体系;2013年,拱墅区开始新体系实践;2014年,新体系课堂在"千课万人"舞台展示;2015年,举办全国新体系教学研讨会;2016年,新体系课堂在全国经典
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
[目的/意义]智慧专业化是欧盟创新发展的指导性方案,帮助欧盟摆脱了经济危机的影响,对其空间分布的研究能够为我国经济社会发展提供有益借鉴。[方法/过程]运用文献研究法、比
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
Based on tetradentate metalloligand LCu ([Cu(2,4-pydca)2], 2,4-pydca = pyridine-2,4-dicarboxylate) and lanthanides (Sm3+, Dy3+), two 3d-4fheterometalliccoordina
目的观察非洛地平缓释片治疗原发性高血压(高血压)的临床效果。方法选择2013年6月—2014年6月收治的高血压患者74例,随机分为观察组和对照组各37例。两组患者确诊后,立即进行抗
This work investigates in-depth the effects of variation of the compositional ratio of the absorber layer in Cu(In,Ga)Se2 (CIGS) thin-film solar cells. Electric
应用平面多电极同步记录技术,对牛蛙视网膜神经节细胞在全域闪光刺激下的放电活动进行胞外记录,并研究ON-OFF型神经节细胞的ON和OFF反应的协同活动模式.分析发现:(1)ON反应之间