高斯混合模型下的相关子空间与离群数据挖掘

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:zhaimeng2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
相关子空间是一种与离群数据有关的属性集维集合,可有效地降低"维灾"的影响.本文利用高斯混合模型重新定义了相关子空间,并且给出了一种相关子空间的离群挖掘算法.该算法首先根据k近邻算法,确定数据集中各数据对象的局部数据集,并依据属性值的稀疏度生成全局的稀疏度矩阵,稀疏度矩阵有效地体现出数据的稀疏性和稠密性;其次,利用高斯混合模型和稀疏度矩阵,识别数据对象的相关子空间和不相关子空间,避免了不相关子空间对度量离群数据的影响;然后,在相关子空间中,利用数据对象每个维度的稀疏度和属性权值,计算数据对象的离群值,并选取离群值较大的若干个对象作为离群数据;最后采用人工和UCI数据集,实验验证了该算法的有效性.
其他文献
计算机实验室作为高校的实验教学场地,承载着计算机基础教学和专业课程教学的双重教学任务。由于实验室面对的人员复杂,素质不一,使用的频率高,所以实验室的管理和维护工作遇
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
Ivy bridge处理器从2011年就被业内和用户高度关注,虽然那一年恰好是Sandy Bridge-E风光之时,然而后者给业内和用户们带来的惊喜并不大,以至于对Ivy bridge的期待被无限拔高了。现在,Ivy bridge真的就出现在了我们眼前,它到底有多强悍呢?这个采用了22nm工艺的芯片能给我们带来惊喜吗?
通过对单路径传输的缺点和随机多路径传输的不足的研究,提出了一个针对多穴主机的基于延时探测的网络层并发多路径传输算法,此算法能够动态适应链路性能的变化并且可以充分利用多个可用路径进行并发传输。NS2仿真实验表明,本算法获得了合理的吞吐量,延时和抖动性能。
6月18日,由中华全国工商业联合会水产业商会、湛江市水产进出口企业协会主办的2017中国国际水产博览会暨中国海鲜食材采购大会在湛江国际会展中心隆重开幕,此届水博会还得到
期刊
分析了上海消防科技工作的现状和面临的形势 ,提出了上海消防科技工作的奋斗目标和发展前景 Analyzed the current situation and situation of Shanghai fire protection s
2004年1月17日至18日,国务院在北京召开全国安全生产工作会议.这是新中国成立以来第一次以国务院名义召开的全国安全生产工作会议.会议的主要内容是贯彻落实.rn中共中央政治
6月15日,第五届现代渔业发展论坛在安徽合肥隆重举行.本次论坛由中国渔业协会和清华大学两岸发展研究院共同主办,受到了行业及各大媒体广泛关注,各企事业单位代表近600人参加
期刊
期刊
1月17日到18日,国务院在京召开全国安全生产工作会议。1月17日下午,记者旁听了第四组的讨论。海南、广东等6省主管安全的副省长,针对黄菊副总理的报告结合本省的实际情况,展