一种用于处理高维稀疏数据的半监督聚类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:shicyh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督聚类是近年来研究的热点,传统的方法是在无监督算法的基础上加入有限的背景知识来提高聚类性能。然而大多数半监督聚类技术都基于邻近或密度,难以处理高维数据,因此必须将约减的特征加入到半监督聚类过程中。为解决此问题,提出了一种新的半监督聚类算法框架。该算法利用样本约束传递性进行预处理,然后将特征投影到低维空间实现降维,最终用半监督算法对约减后的样本进行聚类。通过实验同现行主要降维方法进行了比较,说明此方法能有效地处理高维数据,聚类效果良好。
其他文献
多媒体数据流包含多种数据形态(文本、图片、音视频)和多种通道信息(地址信息、链接信息、时间和会话信息等)。多媒体数据流通道之间具有一定的内容相关性。以往对多媒体过滤的相
枚举问题的多个最优解是计算机科学中人们日益关注的一个研究方向。运用固定参数枚举理论和着色技术对3一维匹配问题提出了一个高效的固定参数枚举算法,即给定一个含有n个带权
无传统意义上的载波带来的低复杂度特性是脉冲无线电超宽带(ultra-wideband,UWB)通信的一大优势,既有较佳的接收性能又有简单的结构是UWB系统设计的目标。提出了一种基于振幅比
支持属性的委托模型(ABDM)中,受托者必须同时满足委托先决条件(CR)和委托属性表达式(DAE)才能获得委托权限或角色。在该模型中,委托撤销完成将委托出去的权限收回到委托者处的工作。
通过系统辨识建立了Apache Web服务器的线性时不变(LTI)模型,用于描述两类Web客户连接的连接延迟比与服务线程比间的关系,并针对此LTI模型,设计了一个控制器。此控制器通过动态
提出了一种进化泛函网络的建模与函数逼近方法,该方法把泛函网络建模过程转变为结构和泛函参数的优化搜索过程,利用遗传规划设计泛函网络神经元函数,对网络结构和参数共存且相互
LSB匹配隐写具有嵌入量大、视觉隐蔽性高的优势,但采用LSB匹配隐写算法对于载密图像的灰度直方图有明显的平滑作用,因此攻击者可以基于直方图分析图像是否载密。通过研究LSB匹配算法对直方图产生影响的机理,提出一种基于相邻灰度值互补嵌入的LSB匹配改进算法。该算法利用匹配像素灰度值加减1对直方图的影响具有互补性的特点,以相邻灰度值匹配像素对为对象进行成对嵌入,有效地保持了直方图特性,极大地提高了算法的
数据挖掘技术的进一步发展同新理论和新方法的应用密切相关。超图以图论和集合论为基础,近年来在数据挖掘领域超图理论已经得到运用。首先概述了超图的基本概念,然后重点介绍结
针对现有无线传感器网络MAC协议不能提供数据业务优先级区分的问题,在充分分析S-MAC协议的基础上,提出了一种基于区分服务的MAC协议改进机制——DQ-MAC(Diffserv-based QoS-aw
根据2007年王圣宝等人提出的一类基于身份的密钥协商协议的特点,对私钥泄漏模仿攻击的分类进行了扩充,之后具体分析了王等人的协议,发现该协议不能抵抗扩充的私钥泄漏模仿攻