基于Storm的流数据KNN分类算法的研究与实现

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:SanMaker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
KNN算法是一种简单、有效且易于实现的分类算法,可用于类域较大的分类。近年来对KNN算法的研究偏向于静态大数据集,不过,在越来越多的情况下要用KNN算法在线实时处理流数据。考虑到流式数据流量大,连续且快速,不易存储和恢复等特性,以及流处理系统Storm对流数据处理具有实时性、可靠性的特点,提出了基于Storm的流数据KNN分类算法,该算法首先对整个样本集进行划分,形成多个片集,然后计算出待分类向量在各片集上的K近邻,最后再将所有片集K近邻归约得出整体K近邻,实现待分类向量的分类。实验结果表明,基于Stor
其他文献
[目的]总结终末期糖尿病肾病(DN)病人在长期维持血液透析过程中预防低血糖的护理措施。[方法]回顾性分析10例终末期DN病人行长期维持血液透析的临床资料。[结果]本组10例DN病人
医院X线床边摄影,在基层医院多见,它以简便、快捷、高效的优点为广大患者或不宜搬动的患者带来福音,也为临床医师的诊疗工作提供了一些方便,深受医师、护士、患者及其家属的
为解决枯萎病等土传病害造成的土壤连作障碍,以两个日本葫芦经多代自交筛选而成的稳定自交系JS01-1-3-2-1-5-7-4为母本,JP01-3-3-2-1-4-2-6为父本,杂交选育而成西瓜嫁接专用砧木
为了经济、有效、合理地施用氮肥,对12年生的柑橘品种太田碰柑、国庆1号和纽荷尔脐橙进行了试验,分析了叶面喷施硝酸铵对其叶片相对含水量、叶绿素含量等生理指标的影响。结果
数据驱动的有监督联合分割可以通过先验知识的学习,达到更精确的分割与标注要求。然而,目前的有监督分割方法大多需要耗费大量的训练时间,不利于大规模数据集的扩展。为了提高学习效率,提出一种基于极限学习机同时对面片和网格边进行训练的快速的三维形状分割和标注方法。进而通过图割优化进行分割边缘的平滑和优化,得到最终的标注结果。实验结果表明,在三维形状的分割和标注过程中,该方法学习快速,且可以达到较高的分割精度
目的通过窄带成像技术(NBI)和碘染色方法对食管病变进行观察,比较2种技术对早期食管癌及癌前病变的鉴别诊断精度差异。方法经内镜和病理(包括术后病理)诊断为早期食管癌及癌前病
FA-189系浙江省农业厅农作物管理局、浙江凤起农产有限公司从以色列海泽拉公司引进的番茄新品种。2005年6月通过浙江省非主要农作物品种认定委员会认定。通过FA-189单杆整枝
1播种育苗1.1播种期和种植比例黄瓜种子发芽适宜温度为25-30℃,生长发育适宜温度为20-30℃。采种黄瓜的播种期在4月中旬。父母本种植比例为1:10。父本播种时间比母本早10d左右。
目的探讨川芎嗪注射液联合低分子肝素钙辅治慢性肺源性心脏病急性加重期的临床效果。方法将慢性肺源性心脏病急性加重期患者64例随机分为观察组和对照组,各32例。对照组给予
在二化螟种群数量高发期,应根据各种主要治螟药剂的特点以确定施药适期和次数,并重视第2、4代的防治工作,以有效降低虫口基数。