【摘 要】
:
随着社会的发展、科技的进步和互联网络的高速发展,各行各业数据量的产生正呈现出指数级的增长趋势,高频高维的复杂大数据已经被看成是这个时代的代名词.如何高效准确地挖掘
论文部分内容阅读
随着社会的发展、科技的进步和互联网络的高速发展,各行各业数据量的产生正呈现出指数级的增长趋势,高频高维的复杂大数据已经被看成是这个时代的代名词.如何高效准确地挖掘这些大数据背后隐含的价值成为了当前我们迫切的需要.其中聚类分析是数据挖掘的核心技术之一,除了其本身的算法应用之外,还可以作为数据挖掘的一个初始化处理步骤,但传统的数据聚类分析方法在挖掘随机的数据上仍然存在着很多的缺陷和不足.基于网络优化最小树的大数据聚类分析是以大数据为背景,在图论理论的基础上,通过关联分析构造各个数据对象之间的邻接矩阵,以数据点为顶点,各数据之间的邻接矩阵为边的权值,构造一个全图,然后生成该全图的一个最小生成树(Minimum Spanning Tree即MST)根据实际问题和数据的分布状态,按边的权值从大到小切割最小生成树,得到k个MST的子树,一个子树便是数据聚类的一簇最优聚类.本文选取IRIS测试数据集对传统聚类算法进行了仿真模拟分析,得到基于网络优化最小树的大数据聚类算法无论在结果的精确度、计算的复杂度还是计算的效率上较其他几种聚类算法都具有明显的优势,该方法具有处理高维大规模数据的优点,是一种准确、高效、快速的聚类算法,能够很好的解决传统聚类算法的不足.最后本文还对大数据挖掘、聚类分析中可能出现的一些问题进行了探讨并提出了展望.
其他文献
在新媒体发展的浪潮中,手机新闻客户端这种新兴媒体形态,借助手机为媒介,占领了大量用户群体。而在报道同题新闻时如何从同类媒体中脱颖而出,赢得受众,则是注意力经济时代新
目的:分析高频彩超在乳腺良恶性病变诊断中应用与临床诊断。方法:选取2016年1月-2017年8月期间因乳腺肿块症状入我院就诊的160例女性患者,其中经病理证实含96例乳腺良性病变,
<正> 去年二月国家教委颁布的《全日制小学语文教学大纲》与1978年教育部颁布的《全日制小学语文教学大纲》(试行草案)相比,增加了一项重要内容,这就是大纲前言中指出的要“
[目的]研制健康并具有独特紫薯风味的紫薯磅蛋糕。[方法]将紫薯与磅蛋糕相结合,制作一款烘焙产品,通过正交试验、感官鉴评的方法确定最优配方和生产工艺。[结果]试验得出紫薯
通过跌落仿真实验,验证了头型冲击器有限元模型的正确性。取出已经验证了的整车有限元模型前端部分,按照GB/T24450—2009规定,通过Hypermesh建立头型碰撞实验仿真模型,并采用
本文首先阐述了既有建筑围护结构节能改造相对于新建筑建造的特点,然后阐述了上海近年节能改造的重点应放在公共建筑上,接着详细讨论了围护结构改造的重点应放在外门窗的改造
目的:系统评价特拉唑嗪治疗良性前列腺增生的疗效。方法:计算机检索Pubmed、Cochrane图书馆、剑桥大学出版社电子期刊、美国医学会电子期刊、英国皇家化学学会电子期刊、Wiley-
改善建筑围护结构热工性能是既有建筑节能改造的常见措施,建筑围护结构节能改造除了能够降低建筑能耗之外,对建筑物室内热环境有很大影响。本文采用DeST建筑环境模拟工具,对
针对Auto CAD使用过程中没有函数曲线绘制命令的问题,结合数学作图给出了在Auto CAD中绘制函数曲线的简便方法 ,对于Auto CAD的中绘制各类函数曲线有一定的实际意义,拓展了Au
文章对南宋姜夔《续书谱》中"俗"思想和美学进行研究,首先对"俗"字的本义进行整理考释,其次再来分析南宋社会背景下"俗"所代表的的内涵."俗"在历代书论中的阐释不甚相同,其与