云计算平台下神经网络方法研究

被引量 : 0次 | 上传用户:zhk42
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展,网络带宽的不断增长,通过网络访问远程计算资源的条件已经具备,云计算就随之产生了,“云”指的是计算资源不在本地而在网络中,对用户是透明的。近年来,Google、IBM、亚马逊和微软等IT巨头们对云计算技术和产品的普及起到了积极的推动作用。云计算是分布式计算、并行计算的发展,主要用于处理大规模的数据,大规模数据处理和计算是数据挖掘领域中的常见问题,许多传统数据挖掘算法如分类中的神经网络算法往往只能用于小规模数据,当处理的数据规模很大时,计算量急剧增大,这无疑是许多传统数据挖掘算法的瓶颈,而云计算则恰好擅长处理海量数据和进行大规模并行计算,如果能够将传统数据挖掘算法并行化,并将之部署到云计算平台上,就可以有效地解决数据挖掘领域中的上述问题。BP(Back Propagation)神经网络是一种按误差逆向传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。它的BP学习算法由网络信息流的正向传播和误差的反向传播更新神经元联接权值两个过程组成。当处理大规模数据时,训练网络的时间很长,因此本文把BP学习算法进行MapReduce化分解,并行运行减少算法运行时间,其主要分解方法是对网络的每一个联接权值计算反向传播生成的权值局部梯度改变量,处理所有样本后用改变量平均值对权值做一次批处理更新。接着对比分析了统计领域常用的Logistic回归分析模型,把该模型看做无隐含层的神经网络,在提出一种大规模矩阵转置和乘法运算的MapReduce化分解方法后,运用到了Logistic回归参数估计的Newton-Raphson法矩阵求解过程中,使Logistic回归也可以并行处理大规模样本数据。论文具体实现了上述算法并部署到Hadoop云计算平台上,采用经典的数据挖掘测试数据集进行对比实验,比较了算法在单机和云计算平台下的运行差异,结果表明在保证算法准确度和精度的情况下,对大规模输入数据,经过MapReduce分解的算法能够有效减少运行时间,在用8台机器组成的实验Hadoop集群上,加速比能达到约4~5,比一般的并行系统具有更好的性能。
其他文献
秸秆高值化综合利用是生物质化工的重要研究方向,可望成为传统石油化工的重要补充。通过化学与生物手段可以将秸秆转化为各类产品,为能源、材料、化工领域提供绿色可再生的制
引导学生通过小组合作、探究性学习方式重现建构DNA分子双螺旋结构模型的历程,通过观察分析、模型制作和DNA分子结构特点的归纳,培养科学的思维方法和分析、解决问题的能力。
基于2017年某地查处的两起涉及CO2气体爆破的案例,分析了CO2气体爆破反映出的问题,总结了CO2气体爆破危害性大、专业性强、涉及面广和欺骗性强等特点,指出了造成这种现象的主
2016年3月26日,由天津大学法学院刑事法律研究中心主办的"留守儿童、流动儿童面临的社会问题与法律对策"研讨会在天津大学召开。全国人大内务司法委员会工青妇室主任秦剑、最高
<正>"现在出口的活鳗基本上都是从广东所出。"广东省鳗鱼协会会长周添雄一句话道出了广东顺德的鳗鱼形势。据初步统计,顺德鳗鱼烤鳗占全国的三分之一,产品出口量占全国的五分
针对经销商从事再制造的闭环供应链最优决策及协调问题,考虑消费者对新产品和再制造品的接受程度不同,本文构建了集中决策和分散决策两种模式下闭环供应链差别定价模型。研究发
移动应用数据流量消耗和响应速度是用户和开发者都非常关心的问题,很多移动应用都使用了缓存技术(特别是HTTP缓存)以有效减少移动数据流量和电量消耗,加快应用响应速度。然而
信任是价值预期,信任是人的行为展开的前提和条件。价值判断和选择与行为预期的互补机制决定了信任的建构,不同文化、不同时代由于价值观和信息传播渠道的差异,所以信任建构
目的探讨髋关节撞击综合征(FAI)的临床诊断和治疗的体会。方法通过总结2002年以来29例门诊患者和5例手术患者的临床资料,分析该综合征的临床表现,骨科检查的特点以及放射学检
沈从文的《边城》呈现了一个充满风情的湘西民俗世界。本文从三方面对其进行探讨——湘西社会的节庆习俗、湘西地区开放的爱情观念及婚俗、湘西对于傩神的信仰。接着,文章综