基于最近邻相似度的孤立点检测及半监督聚类算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:chunguangdong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的聚类算法是一种无监督的学习过程,聚类的精度受到相似性度量方式以及数据集中孤立点的影响,并且算法也没有很好的利用先验知识,无法体现用户的需求。因此提出了基于共享最近邻的孤立点检测及半监督聚类算法。该算法采用共享最近邻为相似度,根据数据点的最近邻居数目来判断是否为孤立点,并在删除孤立点的数据集上进行半监督聚类。在半监督聚类过程中加入了经过扩展的先验知识,同时根据图形分割原理对数据集进行聚类。文中使用真实的数据集进行仿真,其仿真结果表明,本文所提出的算法能有效的检测出孤立点,并具有很好的聚类效果。
其他文献
本文提出了一种基于双目立体视觉检测而实现汽车安全气囊装配精度测评的方法,将CCD摄像机提供的待测安全气囊的图像与标准安全气囊的三维数模相结合,建立了汽车安全气囊轮廓
MicroBlaze软核是一种针对Xilinx FPGA器件而优化的功能强大的32位微处理器,它支持CoreConnect总线的标准外设集合,具有兼容性和重复利用性。介绍了以FPGA协同MicroBlaze嵌入式
对灵芝菌的原生质体进行了紫外诱变处理,经初筛和复筛,获得生长速度快、灵芝糖肽复合物(Ganoderma lucidum polysaccharide-peptide complex,GPSPc)产量高的诱变株CAU5501。经10代
研究了导航路径寻优的地图数据库分层索引机理。以路网分层模型为基础,研究并设计了G-SDBCScan(Geospatial Database Convergence Scan)索引算法,并将此算法应用于面向地图数据库的分层索引机制。最后通过嵌入式数据库SQlite在分层索引机制中的应用来验证分层索引机制的有效性。
详细分析了经典LEACH分簇算法及其优缺点后,在LEACH算法的基础上,针对异构无线传感器网络,即节点承担的角色不同,节点传输数据率不同的研究背景下,提出了一种RDCR分簇路由算
本文用逐步回归分析法对影响大交盆地地下水位变化的因素进行变量筛选,找出影响地下水位变化的主要因素是近三年的降水量,得出相应的随机数学模型和平衡时间序列线性模型,用其对
WinCC组态软件功能强大,但是它的报表功能并不完善,网络报表的功能需要通过昂贵的组件WebNavigator来实现,有时无法满足项目需求.针对WinCC报表功能的不足,在研究分析了WinCC数据
来自6窝健康、体重相近的杜长大哺乳仔猪34头随机地分为两组,分别于断奶后饲喂基础日粮或基础日粮+甘露寡糖(MOS),收集仔猪断奶当天(实验前)及断奶后7、14、21和28d粪样,利用PCR/DGGE
<正> 弗兰德斯相互作用分析(Flanders Interaction Analysis)是现代最著名和最广泛应用的一种教学观察法。它是由美国教育家弗兰德斯(Flanders,Ned A.)于本世纪五十年代创设
由于ORB算法所提取的特征点不具有尺度不变性,直接匹配会导致较多的错误发生,本文结合SURF和双向匹配算法的思想,提出了改进的ORB算法:SSORB.首先使用不同尺寸盒状滤波模板与