【摘 要】
:
随着科技的发展,数据分析量剧增,数据分布越来越复杂,高纬度且数据分布复杂的数据集对基于密度聚类算法的聚类表现提出了更高的要求。基于密度聚类算法Density-based Spatial
论文部分内容阅读
随着科技的发展,数据分析量剧增,数据分布越来越复杂,高纬度且数据分布复杂的数据集对基于密度聚类算法的聚类表现提出了更高的要求。基于密度聚类算法Density-based Spatial Clustering of Applications with Noise(DBSCAN)在面临不同的目标聚类被几个具有强内部关联(如线)的数据点“连接”的线性连接问题时,难以区分这种模式而倾向于将这些目标聚类识别为同一聚类,而且DBSACN固定的参数无法满足包含高维且密度不均匀聚类的数据集的聚类需求。为了提高基于密度聚类算法在复杂的数据分布中的适用性,本论文在DBSCAN算法的基础上提出了一种基于密度的自适应识别与调整的空间聚类算法(Density-based Spatial Clustering with Self-adaptive Recognition and Adjustment,简称为SRA-DBSCAN),该算法由数据块拆分器、数据块合并器、局部聚类模块和全局聚类模块配合来获得具备适应性的聚类结果。SRA-DBSCAN首先执行自顶向下的过程,数据块拆分器使用基于信息熵的方式自适应识别分块的阈值和维度,将原始数据集拆分为一组数据块,然后在每个数据块内部执行具有两阶段自适应参数调整能力的局部聚类。为了获得最终的聚类结果,SRA-DBSCAN执行了自下而上的全局聚类过程,利用递归的方式对数据块拆分树进行回溯,其中数据块合并器在全局聚类过程中被用于合并不同数据块中相关的多个局部聚类结果。在多种类型线性连接和固定参数问题同时存在的复杂数据分布的人工数据集上的实验以及多个真实数据集中的实验表明本论文提出的SRA-DBSCAN算法具有自适应识别和调整能力,可以识别数据集内部明显的目标聚类间的边界或目标聚类间的薄弱连接点(线性连接)并在数据块内部自适应调整输入参数,降低算法对输入参数的敏感性,解决了复杂数据分布数据集中的线性连接问题和固定参数问题,在准确率、精确率、召回率和F1-score的多个评估指标上的综合表现明显优于多个对比算法,适用于基于密度聚类算法在高纬度且数据分布复杂的数据分析需求。
其他文献
随着国内智能制造技术的发展,数控机床依靠其高效率和高精度的性能优势,正在逐渐取代传统加工设备。加工工艺与机床夹具是工件加工过程中的重要组成部分,对于保证工件加工精
β-硝基苯乙烯是一类重要的有机合成中间体,被广泛应用于合成各类生物活性分子,药物以及有机合成中间体。其分子结构中的强吸电子基团硝基,使得烯烃电子云发生极化,能够发生
在实际生活中,除同质总体数据外,还存在大量异质总体数据,对于这些数据来说,混合回归模型是重要的统计分析工具之一,并且被广泛应用于生物、医学、经济、金融、环境保护、工业设计等领域。混合专家回归模型在混合回归模型的基础上对混合比例建模,进一步对异质总体数据进行分类、聚类及回归分析。变量选择是统计分析与推断中的重要内容,也是当今研究的热点课题。针对混合回归模型,目前研究较多的是对其参数进行估计,而对变量
僵尸网络已经成为网络安全领域非常严重的威胁,它被证明有能力感染数十亿计算机并驱使它们进行非法活动,给社会带来了巨大的经济损失。对僵尸网络的有效检测有望缓解这一现象
最小加权独立支配集问题(MWIDS)是独立支配集问题的一个重要分支,在独立支配集问题的基础上增加了权值的约束,同样也增加了问题的难度。MWIDS问题已被证明是NP难组合优化问题
随着《公共文化服务保障法》的颁布实施,提供公共文化服务已成为我国各级电视台的法定职责。然而在实践中,地方电视台如何履行公共文化服务职能?地方电视台发起的公共文化服
人脸表情识别和车辆属性识别是图像识别的两个重要应用,人脸表情识别和其它图像识别如人脸识别主要的流程和方式很类似,但有其特殊性,其特殊性在于判断一张人脸的表情主要是
近年来,卷积神经网络在很多领域都取得了显著的成功,尤其是在图像识别领域,其准确率已十分接近甚至超过相关专家的水平。然而,卷积神经网络的工作机制至今仍然没有一个合理严
在当今社会发展中,交通运输行业具有举足轻重的地位,交运企业的利润水平直接反映行业的整体状况。企业利润率一直是国内外众多学者重要的研究课题,然而有关利润率的大量研究仅仅停留在普通的多元回归分析层面,更深层次的探讨还比较缺乏。分层线性模型(HLM)作为一种有效的处理嵌套数据的统计方法,综合考虑了“个体效应”和“背景效应”,在企业利润率的研究方面,通过定义不同层次的子模型,用组内差异和组间差异两方面来解
2014年10月24日,证监会公布了《上市公司重大资产重组管理办法》以及《关于修改<上市公司收购管理办法>的决定》,这次重大资产重组管理办法的修订无疑是监管层朝“去行政化”方向的进一步努力。这次办法的修订有利于持续推动并购重组市场化程度,同时给予企业更大的自主权。这么多年来关于并购重组的研究大多都集中在企业进行并购重组的动机、绩效以及相关监管制度的理论分析上,但针对并购重组监管的实证研