高维数据的增量式聚类算法的距离度量选择研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:zbc518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算法的基础上,使用不同的距离度量函数来衡量样本之间的相似性,以得出不同的距离度量对SpFCM算法的影响。在不同的大规模高维数据集中,使用欧氏距离、余弦距离、相关系数距离和扩展的杰卡德距离来计算距离。实验结果表明,后3个距离度量相对于欧氏距离可以很大程度地提高聚类效果,其中相关系数距离
其他文献
赵树理以他的写作真正实现了文艺大众化的方针,在特定的时期被树为“方向”,成为解放区文艺工作者的楷模;建国后,赵树理无论在创作上还是在人生境遇上都遭遇了磨难,“方向”的意义
杏仁一药为临床所习用。不能只注意它的降咳功用,而忽略了其他的效能。张仲景在《伤寒杂病论》中把杏仁广泛运用于多种疾病,在经方中杏仁有宣肺平喘、开肺疏表、疏表退黄、利
国外的研究表明,贾第虫虽然是一种较低级的真核生物,但确有与其他生物相似的高度发达的、复杂的细胞骨架系统.贾第虫的细胞骨架与虫体的运动、增殖及致病密切相关.因此,将贾
奥巴马执政以来,美国对华贸易保护主义进一步抬头。本文首次从国际政治经济学视角,基于20世纪70年代末以来的三大贸易保护理论,分别从战略性贸易政策、利益集团和技术转移三个方
建立了热流固耦合控制方程,借助Fluent和Ansys软件对多相介质流经管道弯头进行了流场和应力、应变分析,探讨了不同入口速度、管径、弯径比、流体温度对弯头冲蚀失效的影响。
伴随20世纪女性主义的兴起以及经济学界对新古典经济学研究范式的批评,把性别及其价值视为重要要素纳入经济问题研究领域的主张促成了女性主义经济学的勃兴。对新古典经济学
在信息化浪潮的推动下,信息化建设已经覆盖了社会领域的各个方面。人力资源社会保障公共服务是事关民生的重要工程,推行多层次、全方位、均等化的人力资源社会保障公共服务平
搅拌罐具有传热传质特性好,处理量大的优势,在化工能源、生物、食品及制药等工业中有着广泛应用,搅拌罐内的水力行为是设计和操控此设备的关键。液固搅拌罐内颗粒流动行为能
民事诉讼法设立管辖异议制度的初衷主要是为了保障法院正确行使审判权,克服地方保护主义,维护当事人合法权益。但近年来,司法实践当中滥用管辖异议权时有发生,且有越演越烈之趋势。这一问题的产生,除行为人想拖延诉讼和追求不法目的外,更源于管辖异议制度自身的缺陷。滥用管辖异议权的行为不仅侵害了相对方的合法权益,降低了诉讼效率,而且严重地损害了司法权威,浪费了司法资源。由于目前我国对管辖异议权滥用问题研究不够深
为了计算不同厚度铅对不同能量γ射线的屏蔽性能,本工作建立了两种模型,然后使用MCNP程序对这两种模型进行模拟计算,进而得到了铅的屏蔽性能。计算结果表明:相同厚度的铅屏蔽层对