Hadoop的SKNN文本分类算法的设计与实现

来源 :信息化建设 | 被引量 : 0次 | 上传用户:X446873887
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的日新月异,信息技术在不断发展,可以说这个时代就是一个信息爆炸的时代.针对海量的信息处理,文本分类技术应运而生,这种技术可以对大量的文本数据进行有效的组织.其中,SKNN文本分类算法是经典KNN分类算法中的一个重要组成部分,这一方法大大提高了KNN分类算法的利用率.本文以Hadoop为基点,从Hadoop平台和文本分类概述、基于MapReduce的文本预处理方法以及基于MapReduce的SKNN分类算法三个方面进行详细论述.
其他文献
主要对二自由度平面欠驱动机器人的操作空间控制问题进行了研究,提出了一种适用于此类欠驱动机器人的模糊控制新方法.将欠驱动机器人末段位置控制问题进行分解,设计了一种新
随着国内企业信息化建设的高速发展,企业对数据分析类管理系统的需求越来越迫切,本文介绍了操作型数据存储系统的基本概念和产生背景,对操作型数据存储系统与数据仓库之间的
虽频繁有资金交易往来,甚至最大的一笔将近400万元,但不足12万元的欠款余额,五年间杨某仍没有偿清。6月28日,海南澄迈县人民法院受理了海南大某水产饲料有限公司(以下简称大某公司
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
针对工业控制领域中对Windows操作系统的实时性需求,提出在Windows驱动程序中设计实时内核并进行任务调度的方法.着重研究了Windows驱动实时系统的实现方案和系统结构以及实
在交通建设系统中,路桥建设是非常重要的部分,同时路桥建设也关系到国民的生计问题。在近年,随着路桥工程规模的不断扩大,各种不确定因素也随之增加。对路桥设计的隐患排除能够减
ad hoc网络是一种新型的无线移动网络,因其独特的组网特性,使得安全问题成为其发展的最大束缚。路由协议的安全是自组网安全的一个重要部分。本文首先论述移动AdHoc网络中的安全问题,介绍了多种安全路由的协议和方案,并对其中的三种按需安全路由协议进行了比较,最后提出进一步研究AdHoc网络路由安全应注意的问题。
我国空间太阳望远镜(SST)项目采用了StaceWire作为传输总线,目前针对Spacewire总线的验证主要采用测试和模拟等传统的方法,这类验证方法是不完备的.本文旨在对SST项目中Space
3.田间灌溉工程灌溉沟布局以与排水沟相邻较好。工程建设中应根据灌溉水源特点,完善配套引水设施。①灌溉水源高于农田。建好导水渠,将水导入灌溉沟就行。②灌溉水低于农田。
采用格型抽头滤波器来实现柴油机主动隔振,通过梯度自适应格型算法对格型结构的反射系数及抽头部分的衰减系数进行计算更新.误差通道采用离线辨识方法,针对双层隔振系统进行