【摘 要】
:
异常检测是数据挖掘的重要研究领域,当前基于距离或者最近邻概念的异常数据检测方法,在进行海量高维数据异常检测时,存在运算时间过长的问题.许多改进的异常检测方法虽然提高了算
【机 构】
:
中国科学院大学,天基综合信息系统重点实验室(中国科学院软件研究所)
【基金项目】
:
国家自然科学基金(U1435220);国家高技术研究发展计划(863)(2012AA011206)~~
论文部分内容阅读
异常检测是数据挖掘的重要研究领域,当前基于距离或者最近邻概念的异常数据检测方法,在进行海量高维数据异常检测时,存在运算时间过长的问题.许多改进的异常检测方法虽然提高了算法运算效率,然而检测效果欠佳.基于此,提出一种基于密度偏倚抽样的局部距离异常检测算法,首先利用基于密度偏倚的概率抽样方法对所需检测的数据集合进行概率抽样,之后对抽样数据利用基于局部距离的局部异常检测方法,对抽样集合进行局部异常系数计算,得到的异常系数既是抽样数据的局部异常系数,又是数据集的近似全局异常系数.然后对得到的每个数据点的局部异常系
其他文献
在全球老龄化的大背景下,中国人口老龄化有着来势猛、速度快、经济社会发展跟不上老龄化进程等问题,如何从一个设计师的角度来改善老年人的生活环境,为他们创造一个老有所养
无刷直流电机(Brushless Direct Current Motor,BLDCM)是一种取消了直流电机的碳刷和滑环等换相装置,又具有普通直流电机相同调速性能的特种电机,具有效率高、寿命长、可靠性
在英语教学当中,英语写作是它的重要组成部分,英语写作代表着学生在英语学习中的书面表达能力,目前对于英语教师工作者而言,怎样提高学生的英语写作水平是他们将要研究的主要
目的研究天冬降糖胶囊对四氧嘧啶糖尿病小鼠血糖、血脂等血液生化指标的影响.方法给小鼠尾静脉注射四氧嘧啶90 mg/kg,造成糖尿病模型.用自动生化仪测定血糖、血脂、肌酐、谷
以发达国家"再工业化"和发展中国家加快实现工业化为特点、以产业提质增效升级和新动能培育为核心的新一轮全球制造业竞争正在全面铺开。推进更高水平开放、促进多边合作与互利
本文对LTE核心网的网络建设进行分析,并探讨其安全性,以期有利于提高其应用水平,从而推动信息化时代的建设与发展.
<正>全省宣传思想工作会议,是在全省上下深入学习贯彻党的十八大和全国宣传思想工作会议精神,加快建设"五个龙江",力争提前实现全面建成小康社会奋斗目标的新形势下,省委召开
加强医院药品采购招标,对解决药品购销中的腐败现象和药价虚高,减轻患者的用药负担有着重要意义。文章研究了医院药品采购招标的重要意义,分析了我国医院药品采购招标现状,提
煤矿生产中地质钻探工作是保证煤矿能够实现安全生产的重要环节,在地质钻探过程中经常会遇到瓦斯、深孔以及坍塌等问题,这些问题都会引起十分严重的安全事故。因此,作为煤炭
【正】 《逸周书》是我国现存最古的史书之一,西汉学者刘向概括此书内容为“周时诰誓号令也”。原有七十一篇,今本只有五十九篇。它是研究西周历史极为珍贵的史料。梁启超、