面向稀疏数据集的聚类算法

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:xiang879154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在聚类过程中数据可能呈现稀疏性,如果仍用传统的欧式距离作为聚类指标,则聚类的质量和效率将会受到严重的影响。受到信息论中KL(Kullback-Leibler)散度的启发,采用基于KL散度的相似性度量方法,先描述数据的整体分布,进而对数据进行聚类。研究结果表明,最后通过实验验证本算法的有效性。这种方法可以利用簇中元素提供的信息来度量不同簇之间的相互关系,克传统欧式距离的缺点,提升算法准确度。
其他文献
近年来,基于人工神经网络的气象空间插值研究因其较强的非线性映射能力受到越来越多的关注。然而,由于网络参数众多,这些方法的训练过程都非常耗时。考虑到以上原因,基于宽度
采用二次通用旋转组合的设计方法,对喷气涡流纺纺纱技术的3个主要工艺参数——喷嘴压力、前罗拉到纺锭顶端的距离、纺纱速度进行了优化组合,分析了它们与纱线性能指标之间的关
为提高工业机器人的控制及示教水平,首先设计串联弹性驱动器关节机械臂零力控制系统和比例-积分-微分(proportion integration differentiation,PID)位置控制系统,然后搭建MA
近期国内棉花价格开始显露“升机”,市场出现普遍上涨情况,涨幅较大的地区比2007年5月底高出近500元/t。而此番涨价与国内棉花库存下降和外棉进口减少有关。由于近期国内棉花资
介绍了两种信号谱分析方法——基于Fourier变换思想的波谱分析及基于经验模态分解的Hilhert边际谱分析,并将其分别应用到纱线信号的时频分析中。基于经验模态分解的边际谱分析
腔镜技术自从1999年应用于甲状腺切除术后,由于其具有切口小、美观的优势,在全球范围内广泛应用[1]。虽然腔镜甲状腺切除后种植转移等并发症的报道较少,但其仍是腔镜手术的并
《化纤针织内衣》和《婴幼儿针织服饰》等8个纺织服装行业标准于2007年7月起正式实施。新标准对我国纺织服装发展将起到重要的指导作用。
黄河防洪关系到国家经济建设和社会安定。为确保防洪安全,一旦黄河发生非常洪水,需向北金堤滞洪区分洪10000m~3/s。根据目前状况,北金堤滞洪区除了继续完善防洪工程体系外,还
期刊
为了在一副模具上实现多品种汽车纵梁成形,采用了组合式的模具结构,解决了纵梁品种多,模具投资大的问题,并能快速的适应不同车型的纵梁成形,很好地解决了批量小,但手工又无法加工生