基于密度的最佳聚类数确定方法

来源 :中国管理信息化 | 被引量 : 0次 | 上传用户:zhh6622692
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
确定数据集的正确聚类数目是聚类分析中的一个基础性难题。常用的聚类数确定方法通常依赖特定的聚类算法,且在数据集存在子簇群的情况下效果欠佳。本文提出一种新的最佳聚类数确定的指标,该指标着重于分析簇的几何结构,从数据对象分布密度的角度来度量类内紧密度与类间分离度。该指标对噪声不敏感并且可以识别数据集中的子簇群,在实际数据和合成数据上的实验结果表明,新指标的性能优于广泛使用的其他指标。
其他文献
硫化氢是一种窒息性气体。急性硫化氢中毒是生产环境中短期内接触大量硫化氢引起中枢神经系统,眼结膜和呼吸系统损害为主的全身性疾病。 常州××厂生产叶酸的硫化工
针对在海量数据中,如何有效地自动获取文摘以提高检索效率的问题,本文提出了一种自动文摘中主题区域划分的方法。该方法对文章段落向量模型进行聚类分析,得到文章的主题结构
农村包围城市的革命道路理论,是以毛泽东为首的中国共产党集体智慧的结晶.周恩来对这一理论作出了突出而又独特的贡献:领导八一南昌起义,首探中国革命新道路;通过对革命经验
当今社会是一个快节奏的社会,快节奏的生活导致人们经常丢失物品,一些重要物品往往无法找回。失物难寻、拾物难还的情况越来越多,高校里尤为明显。基于此,建立一个高效、简洁
针对Job-Shop调度问题,详细讨论了遗传算法以及染色体编码方法,建立了算法模型。通过仿真实验,验证了该算法的有效性。
以冯特和他的三个著名学生——卡特尔、屈尔佩、铁钦钠为例,探讨了心理学史中普遍存在的师承关系现象。关注心理学家、心理学派间的学术渊源、继承演变可以引导学生在整体的
运用文献资料研究法,通过对国家有关政策、法规文献的调研,专家访谈及定量分析,就转型期我国学校体育课程教学目标发展现状、国内外学校体育课程教学目标进行比较与分析;对转
在POE交换机产品网口的浪涌测试中,不同的标准会使测试项目、拓扑图、阻抗有很大的差异,同一个产品测试的结果也会出现差异性。文章依据国内、欧盟的认证测试标准以及行业的
使用虚拟基因库技术,对用于邮件分类的人工免疫系统(AISEC)进行改进,提出了动态人工免疫分类算法(DAICA)模型,改进了AISEC的抗体更新过程。当分类正确时,充分利用参与正确分类的抗体,快速改善抗体质量;当分类错误时,不再是简单地将参与错误分类的抗体直接移去,而是对这些移去的抗体进行体细胞高频变异,以保持先前遇到的抗原信息。还研究了新算法DAICA中使用的参数α与β对算法性能的影响。实验表明
账户的合理化设置,避免账户之间的串户,并保障会计数据的正确性,以及报表公式和数据的合法性是本文要讨论的问题。文中给出了设置依据并进行了验证。