Canopy算法相关论文
随着我国信息化程度的不断提高,各类信息技术和手段也在医疗行业得到了广泛的应用,信息系统的应用能够有效记录患者信息、检验结果......
聚类算法是数据挖掘中的重要内容,能够从数据中提取出隐藏的有用信息和知识来为人们服务,在工业、商业以及科研领域都得到了广泛应......
随着互联网技术的飞速发展,越来越多的网络媒体出现在我们的日常生活中,微博凭借其信息多样性、发布消息的实时性等特点,已成为大......
针对传统k_means聚类算法在处理海量数据时所面临的内存不足、运算速度慢等问题,提出了一种基于Map Reduce的K_means并行算法,同时......
针对传统的聚类算法K-means对初始中心点的选择非常依赖,容易产生局部最优而非全局最优的聚类结果,同时难以满足人们对海量数据进......
传统聚类算法K-Medoids对初始点的选择具有随机性,容易产生局部最优解;替换聚类中心时采用的全局顺序替换策略降低了算法的执行效率;......
传统的有序用电方式都是硬性的调控,没有考虑用户的利益,用户响应度差。本文基于国网公司现有的SG186和SG-ERP工程建设采集用户用......
摘要:事件要素识别主要包括时间要素和地点要素的识别。目前,时间和地点要素的识别主要是利用机器学习的方法,但是基于机器学习的方法......
基于工业领域广泛用到的Hadoop分布式计算平台,使用Canopy+K-means算法对手写数字进行聚类研究.针对传统Canopy算法初始阈值的确定......
针对传统的串行K-means聚类算法在处理海量数据时出现性能及初始聚类中心敏感等问题,提出了一种基于Hadoop平台的并行CK-means聚类......
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚......
当今,网络应用得到了极大的普及,随之产生的网络安全问题成为人们关注的焦点。为了解决网络安全产生的问题,研究人员提出了许多方......
当今,云计算在全球IT企业中被广泛研究和应用,各行各业的发展都越来越离不开云计算。云计算中最关键的突破是资源使用方式的改变,......
在日常生活中我们所接触的许多信息都是以文本存储的形式进行传播的,如博客、微博、网页等。由于大数据时代的到来,让Internet上的......
为辅助银行机构进行精准的服务推荐,提出了基于改进的Canopy和共享最近邻相似度的聚类算法。基于该算法对用户进行细分,针对用户群......
协作过滤算法(CF)在推荐系统中难以处理数据的稀疏性和可伸缩性问题。本文提出了基于类别偏好Canopy-K-means的协同过滤算法(CPCKC......
针对K-means算法聚类质量和收敛速度取决于初始聚类中心选取的问题,提出了一种利用最小方差获取Canopy最优全局中心作为K-means聚......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引人MapReduce并行框架,利用Ca......
为解决传统K-means算法在处理海量数据时存在的不足,提出了1种适用于并行Canopy-Kmeans算法的迭代式MapReduce模型。通过Canopy算......
随着智能电网的不断建设和发展,在智能终端积累了大量基础用电数据,这些数据具有海量、高频、分散等特点,如何将其转化为有价值的知识......
针对划分聚类算法中聚类数K的取值工作量较大的问题,提出一种新的Canopy+算法.该算法可实现对聚类个数K的预判,在保证准确率的前提......
提出一种基于MapReduce框架的商品评论热点发现并行算法——PR-HD算法.PR-HD算法使用爬虫技术提取某电商平台下某热门手机的评论数......
三峡库区不仅是长江流域的生态安全屏障,更是全国淡水资源的战略储备基地。二期蓄水完成后,水流减缓,自净能力下降,库区水环境监测......
传统的评论选择算法都是基于商品评论的有用性以及评论中所包含的信息量,这就导致所选择出来的评论集冗余度和重复率较高。所以,基......
K-Means算法是一种基于划分的算法,具有实现简单、效率较高的特点,但存在对初始中心选取依赖性强、分类数K未必总是已知及算法频繁......
针对用电数据量大、用电数据挖掘效率低等问题,采用理论分析和实验的方法,进行用电数据并行分析构架的研究,研究了Canopy和K-means......
随着数据的爆炸式增长,聚类研究作为大数据的核心问题之一,正面临计算复杂度高和计算能力不足等诸多问题。提出了一种基于Hadoop的......
针对集中式系统框架难以进行海量数据聚类分析的问题,提出基于MapReduce的K-means聚类优化算法。该算法运用MapReduce并行编程框架......
为了解决在复杂的、数据量庞大的高光谱图像中汇集出参考价值较高的聚类组合问题,本文提出一种基于流形的K_Medoids改进算法并应用......
互联网内容提供商在实际运营过程中,所维护的各项业务随时可能会遇到各种各样的问题,将相应的大量错误日志经过聚类后及时反馈给相......
在云计算技术之上,通过MapReduce调度器,对样本数据根据其大小拆分成一些数据块,采用并行分布式计算算法对客户进行聚类。在已生成......
3C章针对物流企业的订单分批问题,提出了改进的Canopy-k-means算法。该算法是采用Canopy算法依据最大最小原则生成初始聚类中心,并使......
汽车售后服务配件库存分类管控多使用传统ABC分类法进行配件分类,这种方法分类标准单一有一定的缺陷性,提出一种基于Canopy-FCM模......
模糊C均值(FCM,fuzzzy C-Means)算法是一种在大数据分析领域广泛使用的聚类算法,由于FCM的聚类结果和聚类速度很大程度上取决于初......
针对局部空间信息的模糊C-均值算法中空间影响因子容易受到噪声影响出现错误标志的问题,提出一种融合局部和非局部空间信息的模糊C......