基于HBase的多分类逻辑回归算法研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:rita88ye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决在大数据环境下,用于训练多分类逻辑回归模型的数据集可能会超过执行计算的客户端内存的问题,提出了块批量梯度下降算法,用于计算回归模型的系数。将训练数据集存入HBase后,通过设置表扫描对象的起始行键参数,可取出大小合适的含训练样本及结果值的数据块;同时为避免客户端到服务端频繁的RPC调用,取出的数据块可进行多次迭代计算,以加快系数的收敛。当取出的数据块达到指定的迭代次数后,再按行键次序取出下一个数据块。如此循环,直到系数收敛或达到指定的循环控制阈值。多分类的逻辑回归问题可转换为二分类来解决,因此需要为每一个分类在训练数据表中设定结果值列,结合训练样本列簇,按块批量梯度下降算法得到每个分类的回归系数。实验结果表明得到的回归系数能准确地对测试样本进行分类。
其他文献
由玉溪大红山矿业有限公司、昆明理工大学和昆明冶金研究院合作共同实施的项目“大红山式铁矿资源高效分选关键技术及产业化”,突破了精矿品位与回收率同时提高的技术瓶颈,首次
萤石下游产品价格大涨,让不少公司动了向上游扩张的念头。永太科技7月公告,公司7月13日与海南鑫辉矿业有限公司控股股东胡毓前签订了股权转让协议,公司拟以自有资金9800万元,
自“双一流”建设高校及建设学科名单公布以来,不少地方高校结合自身学科建设实践中的困境,开始思考和探索高校学科建设的新思路。从学科定位和办学特色来看,某些地方高校与
本文选取江苏经济第一市——苏州市作为典型对象,基于苏州市房地产业发展现状及2009-2018年苏州市房地产相关数据,使用SPSS软件进行Pearson相关性分析,研究并讨论影响城市商
当前,随着我国网络技术和信息技术的蓬勃发展,数字化成为了小型图书馆的未来建设以及发展方向,数字图书馆也必将取代传统图书馆,成为传播信息和知识的重要场所.本文主要针对
在遂宁市商业银行近日举办的中心机房改造项目UPS设备招标中,台达NT系列UPS在众多知名品牌参与的竞争中,以稳定的质量和出色的性能价格比脱颖而出,一举获得本次定单,为遂宁市商业
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
数据管理与智能计算的深度融合已经成为大数据时代顺利前行的迫切需求.智能数据管理旨在“为数据增添智能”,是数据科学与技术的重要基石,更是大数据产业蓬勃发展的关键支撑.
目的总结经脐单孔腹腔镜行精索内静脉高位结扎术护理配合经验。方法本组24例均采用单孔三通道穿刺器及单孔腹腔镜专用手术器械,行精索内静脉高位结扎术,术前、术中给予精心护
目的探讨宫颈冷刀锥切和LEEP术对宫颈上皮内瘤变患者妊娠结局的影响。方法采集于2017年1月—2018年12月期间在该院妇产科接受宫颈手术治疗的68例宫颈上皮内瘤变患者作为重点