基于网格点密度估计的聚类算法研究

来源 :兰州大学 | 被引量 : 4次 | 上传用户:liongliong444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习算法的研究是人工智能领域中的一个重要分支,它涉及到众多学科的交叉融合。机器学习算法的研究对象是怎样模拟人类的行为以学习新的知识从而更新知识结构、改善自身的性能。机器学习领域的研究在近些年来已经取得了很大的进展,各种各样的机器学习算法也被提了出来。机器学习算法通常情况下可以被分为三大类:有监督学习算法、无监督学习算法和半监督学习算法。聚类分析算法是其中最具有代表性的一种无监督机器学习算法。该类算法依据数据点的某种属性将数据集中相似的数据点划分到同一个类簇中而把非相似的数据点划分到不同的类簇。尽管各种各样的聚类算法已经被提出,但是大多数传统的聚类方法只能适用于球形类簇的聚类并且算法的聚类结果可能会受到参数设置和初始化的影响。此外,当数据集中数据点数量和数据维度的规模变得非常大时,聚类算法的效率将受到时间复杂性和空间复杂性的限制。因此,本论文中提出了一种快速稳定基于网格的能够识别任意形状类簇的聚类方法,该算法还能够稳定地应对大数据集的聚类。改进的方法中,首先该方法运用给定的公式自动化确定网格的划分区间数目,然后算法计算划分网格中网格节点处的密度值而非传统方法中的网格密度。最后,算法依据网格节点的密度值采用经典的广度优先搜索算法进行聚类操作。在多个人工数据集和真实数据集上的实验结果表明,该方法比传统的聚类方法更加有效。此外,聚类算法结果的评价通常需要计算聚类评价指标的值,传统的点对比较方法对于大数据集的评价指标计算效率比较低。本论文中给出了利用混淆矩阵计算聚类结果评价指标的方法,实验结果表明该方法能够明显地提高获取评价指标值的效率。
其他文献
各个民族的语言各有其特点,如何将包含异国文化的词语翻译成为维吾尔族儿童读者所能理解和接受的维吾尔语,从而达到民族交流、文化传播的目的便成为了翻译研究的一个重要课题
在大力发展区域环境经济的背景下,实现区域环境经济指标体系的科学构建很有必要。基于这种认识,本文对区域环境经济指标体系的构建原则展开了分析,然后从区域环境经济规模、
针对传统眼底照相机检查不到视网膜边缘的缺陷,提出一种基于Volk角膜接触透镜的免散瞳广域视网膜成像系统。照明充分时,Volk镜头能够达到130°以上的视场。在传统眼底相机的
我国民营企业成本控制与管理对企业成长有着重要的意义。但是,目前民营企业成本控制与管理的现状堪忧:大部分民营企业成本管理者的综合素质偏低;成本控制观念落后;成本管理模
研究糖尿病变,定期的眼底筛查清晰病变图像,是发现和治疗病变的重要手段。图像清晰度评价函数的选择是自动对焦技术的关键。为了保证对焦的精度,提出了以血管边缘的清晰度作
随着社会经济发展和医疗体制变革,国内三级医院数量和规模迅速发展,整体规模过大,带来一系列问题。分析了国内三级医院规模不断扩张的原因,并针对性提出政策建议。国内三级医
据统计,燃煤排放到大气的烟尘和二氧化硫量占全国总排放量的70%和90%以上,也是雾霾形成的主要原因,特别是城乡结合部及农村的'燃煤取暖'排放量惊人,大于工业排放,环
K均值聚类算法是一种划分算法,因此存在一些缺陷,为了解决此问题,模糊C均值算法引入了隶属度U,解决了“硬”划分问题,但是模糊C均值不能初始化聚类中心和聚类个数。近邻传播算法算法是一种新型聚类算法,在效率方面比传统的算法有优势,但是面对非球状数据集的时候,不能产生好的聚类结果,基于以上问题,提出以下几个研究方面:针对模糊C均值不能初始化聚类中心和聚类数的缺陷,本文首先使用Init-cluster选择
背景:文献表明脊柱力线与腰痛密切相关。目的目的:研究不同腰痛疾患的脊柱力线特征。方法方法:选择2017年1月至2018年1月69例腰痛患者,其中非特异性腰痛(nonspecific low bac
[目的]观察布拉氏酵母菌联合维生素D治疗炎症性肠病的临床疗效及炎症因子的变化。[方法]将90例炎症性肠病患者,随机分为观察组和对照组各45例。对照组用布拉氏酵母菌1.0g/次,