【摘 要】
:
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首
【基金项目】
:
太原科技大学青年基金项目(20093015)
论文部分内容阅读
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。
其他文献
高中物理教材(选修3-5)中记载了父子诺贝尔奖获得者英国物理学家J·J·汤姆孙和G·P·汤姆孙,令人称奇的是J·J·汤姆孙因研究电子的粒子性获得1906年诺贝尔物理学奖;G·P·
工程变更是工程项目施工过程中不可缺少的环节,同时也是影响工程造价的主要因素之一。随着国际组织及外商对中国基础设施投资的增长,FIDIC合同的部分内容逐渐成为我国建设施
体育是一种人类的身体运动文化。身体动作是体育的基本构成单元,承载并表达着千百年来不同文化赋予体育的不同价值和观念。体育活动中身体动作的文化价值和意义是体育人类学
本文结合某公司自动化立体仓库系统(AS RS)实施过程,分析研究了出库作业的相关因素,给出了一种有效的出库算法———均匀出库算法,算法主要包括获得客户优先级的算法,出库托
<正>金属的腐蚀是金属在环境介质的化学或电化学作用下引起的破坏和变化的现象,它遍及国民经济各个领域,给国民经济带来了巨大的损失。所以,如何有效地防腐蚀是金属表面处理
蚁群算法是一种新型的模拟进化算法。是继GA、SA、TS等算法之后求解组合优化问题的一种新思路。人工蚁群算法通过模拟蚁群搜索食物的行为,采用正反馈结构、分布式计算与某种
风光资源是可再生能源,研究其互补性对于风光互补发电系统研究有着重要的意义,但是二者在时间和空间上受气象条件影响较大。以山西省11市(县)一年各月平均风速实际数据分别对
本文首次提出"复体裁"这一概念,它是笔者在对西方音乐创作中出现的体裁复合现象进行观察和研究后做出的一个思考。全文从体裁概念的梳理及归类方式、"复体裁"现象的演变过程
驼路沟钴矿床是近年来在东昆仑南带中新发现的独立钴矿床。本文在分析区域成矿动力学背景和矿区地质特征的基础上,详细研究了该矿床的地质、地球化学特征,认为该矿床的形成主
行政管理体制改革是深化改革的重要环节。新时期人口和计划生育工作任重道远。要实现未来人口发展目标,转变人口和计划生育工作职能,关键要建设一支高素质的职业化队伍。国家