基于Hadoop的云平台搭建技术研究

来源 :数字化用户 | 被引量 : 0次 | 上传用户:jy168300124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】Hadoop是一个开源的云计算搭建框架,利用它可快速搭建自己的云平台,并且可以在大量廉价的pc机组成的集群上运行应用程序。本文主要论述了Hadoop的发展,以及在完全分布式中靜态ip、jdk、Hadoop、ssh等的安装配置需要注意的问题。
  【关键词】Hadoop 云平台 完全分布式
  一、Hadoop的简介
  Hadoop是Apache 软件基金会旗下的一个开源分布式计算平台,目前得到了大量的应用。很多企业以及研究机构使用Hadoop框架作为研究或者构建自己的云计算服务平台。它基于Java语言开发,Hadoop也包括许多子项目,如:HBase、Pig、Hive、HDFS和MapReduce等,其中最核心组成项目是HDFS和MapReduce。MapReduce和HDFS都是采用主从式架构,通过构建主节点来屏蔽从节点复杂的底层结构。同时,该主从式架构简化了MapReduce使用的文件目录的映射。Hadoop作为一个开源的软件平台使得编写和运行用于处理海量数据的应用程序更加容易。Hadoop有三种安装模式:单机模式,伪分布式,完全分布式。单机模式主要用于开发调试MapReduce程序的应用逻辑。伪分布式是在单机上模拟Hadoop分布式,在单机上配置,数据节点和名字节点均是一个机器。完全分布式模式就是真正多台机器来搭建分布式集群。利用Hadoop解决大数据问题时,我们是用全分布模式来操作Hadoop。
  Hadoop的集群是基于master/slaver模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,而slave有多个。
  二、作为一个开源分布式系统平台,Hadoop具有以下一些优势:
  (1)可扩展性:Hadoop有可靠的存储和处理大数据的能力,扩展非常简单,不需要修改已有的结构。
  (2)经济性:Hadoop将数据分布到由廉价Pc机组成的集群中进行处理,这些集群可以由成千上万个节点组成,且对集群硬件没有特殊的要求。
  (3)有效性:通过数据分发,Hadoop可以在集群节点上并行处理数据,这使得数据处理过程大大提速,为高效处理海量信息打下基础。
  (4)可靠性:Hadoop自动维护一份数据的多个拷贝并自动将失败的计算任务重新部署。
  三、在搭建分布式云平台的过程中需注意的问题
  Hadoop要求集群上每个节点的用户账户名和密码相同,在实际条件下进行Hadoop分布式安装时,还出现了很多未知的问题。
  (1)配置静态IP。采用虚拟机里安装同一版本的ubuntu操作系统,虚拟机设置的是桥接方式,配置好静态IP,这样虚拟机是主机所在以太网的一部分,它被当成主机所在以太网上的一个独立物理机来看待,可以像主机一样访问以太网中的所有共享资源和网络连接。并且各虚拟机之间可以互相ping通,主机与虚拟机之间,以及各虚拟机之间都可以互访。
  (2)配置hosts和hostname文件。在所有的节点上,终端执行命令:vi /etc/hostname,修改hostname文件,将节点的主机名改成不同的名字,便于区分。继续修改hosts文件,使得彼此之间都能把主机名解析为ip,即实现主机名与ip的绑定。
  (3)配置ssh实现免密码登录。ssh是英文Secure Shell的简写形式。通过使用ssh,可以把所有传输的数据进行加密,还有一个额外的好处就是传输的数据是经过压缩的,所以能加快传输的速度。
  首先要保证ubuntu是连着互联网的。然后在终端执行命令安装ssh服务:
  sudo apt-get update
  sudo apt-get install openssh-server
  ssh服务安装好之后,还要在各个节点执行命令ssh-keygen –t rsa –P ‘’生成密钥对,然后通过追加以及修改文件的权限把公钥传送到其他的节点,最后要实现各个节点之间都可以互相无密码登陆。
  (4)保证集群所有的电脑都安装了jdk。Hadoop是基于Java开发的,集群的所有电脑都要安装jdk,并配置环境变量。首先到官网上下载jdk的压缩包并解压,配置环境变量后,最后可通过在终端输入Java –version来验证jdk是否安装成功。
  (5)关闭宿主机与ubuntu的防火墙。
  (6)Hadoop的安装与配置。
  首先在master节点上下载并解压Hadoop安装包,进入Hadoop的conf文件下,找到hadoop-env.sh,指定JDK 的安装位置。然后配置Hadoop的核心文件hafs-site.xml,core-site.xml和mapred-xite.xml,最后还要修改master和slaves文件。完成之后通过命令向各节点复制Hadoop。scp -r hadoop所在的目录 节点的ip:/要放置的位置,在master节点上格式化namenode,bin/hadoop namenode –format,启动Hadoop:bin/start-all.sh,最后查看是否所有进程启动,输入命令jps,验证Hadoop是否成功启动,打开浏览器,查看集群状态分别输入网址http://master:50070,查看即可。
  关闭Hadoop:bin/stop-all.sh
  在搭建平台的过程中遇到了很多的问题,通过查阅资料和询问同学得到了解决,在这期间不仅学习了很多的命令以及知识,同时也进一步了解了Hadoop的工作机制。
  参考文献:
  [1]张岩.基于Hadoop的云计算试验平台搭建研究[J].沈阳师范大学学报2013(1).
  [2]王宏宇.Hadoop平台在云计算中的应用[J].软件,2011(12).
  [3]张建勋,古志民,郑超.云计算研究进展综述[J].计算机应用研究,2010(2).
其他文献
【摘 要】伴随着计算机和多媒体技术的迅猛发展,越来越多的高等院校开设了图形图像制作等相关专业,因其就业前景较好,相应的从事这一行业的教学者、学生乃至社会人员也随之增多。图形图像制作专业相对于其它专业起步较晚,因此在专业资源库建设方面还有很多地方急需完善,换一种方式来说图形图像教学资源网的出现是顺应社会发展需要,同时也是社会发展的必然结果。教学资源网络平台的构建不仅能够解决学生疑惑,还能够对其相关资
期刊
【摘 要】本文阐述了高效教学的观念,作者结合自身于《计算机应用基础》课程的教学经验,从如何安排课程内容,如何管理学生,如何促进课程教学等方面去说明了如何实现高职《计算机应用基础》课程的高效教学  【关键词】课堂效率;计算机应用基础;高职  一、我校《计算机应用基础》教学现状  随着信息化社会的来临,计算机技术日益普及。计算机已经成为人们生活工作中必不可少的办公设备,学生计算机应用水平和计算机文化意
期刊
【摘 要】本文首先说明了MOOC的兴起和影响力,指出了MOOC出现了一些变体,提出我们普通老师对SPOC教学平台的需要。然后介绍了开源教学平台的主要功能。最后,在通用MOOC相关理论的指导下,以《单片机技术》课程的建设为例,说明了SPOC课程建设方法。  【关键词】MOOC SPOC 教学平台  1 引言  随着2012年,Coursera、Udacity、edX三大课程提供商的兴起,逐渐形成了M
期刊
【摘 要】在档案管理工作中,档案管理基础工作,具有多类型、多领域、多内容等特点,因此,档案管理基础工作在现代档案管理中具有非常特殊的性质,必须给以高度重视,才能促进我国档案管理工作水平不断提升。本文就现代档案管理工作存在的问题进行分析,提出档案管理基础工作在现代档案管理中的作用,以满足社会发展需求,推动我国档案管理事业长远发展。  【关键词】档案管理基础工作 现代档案管理 作用  随着经济的不断发
期刊
【摘 要】首先,本文对计算机技术在档案管理中应用的必要性进行了论述;然后指出了计算机技术应用于档案管理面临的困境,包括电子档案的长期保存问题以及档案信息安全问题;接下来,又提出了计算机技术应用于档案管理应采取的措施。  【关键词】信息技术;档案管理;档案安全  前言:现如今,信息技术已成为社会经济运行中不可或缺的关键要素之一。随着信息技术发展的不断深入,其显著的优势和高效的处理能力已覆盖到了越来越
期刊
【摘 要】企业档案是企业在发展过程中所产生的一系列有用信息的综合,它是企业发展的真实历史记录,对于企业发展具有重要的价值和意义,在企业管理中具有重要的地位和作用。因此应当加强新时期下企业档案的管理研究,切实发挥档案在企业发展中的推动作用。  【关键词】档案管理;发展;作用  随着现代企业管理理念的不断深入,企业档案已经成为了和企业人力资源、财产等同等重要的宝贵财富,其地位和作用也逐渐得到了人们的重
期刊
【摘 要】计算机教学的开展要求教师制定科学、合理的教学计划,运用更具针对性的教学策略。其中,实践性策略的运用是培养学生计算机应用能力的题中之义,也是教学改革的重要诉求。本文拟以此为切入口,论述了几种计算机教学的“实践性策略”,希望对相关教学活动的开展有良好的启示意义。  【关键词】计算机教学;实践性策略;小组协作;应用能力;学习兴趣  21世纪已经进入到了一个以计算机和网络技术为主导的时代,信息化
期刊
【摘 要】高职计算机实训教学体系是培养高职学生动手能力的关键环节,具有十分重要的作用和意义。本文详细阐述了高职计算机实训教学体系的现状,并针对构建高职计算机实训教学体系的有效措施进行探讨。  【关键词】高职;计算机专业;实训教学体系;构建  一、高职计算机实训教学体系的现状  计算机技术的广泛应用,促使社会市场对计算机应用人才的需求总量呈直线上升,出现了企业招聘不到计算机人才,计算机专业学生就业难
期刊
【摘 要】本文以笔者所在单位的相关实际应用建设为例,介绍了一种基于移动平台的企业网盘建设方案,对企业网盘的权限设计模型、存储文件分类模型、基于移动应用的企业云存储设计等进行重点阐述,利用企业移动平台把移动应用与企业网盘融合在一起,有较好的通用性、扩展性和安全性,在实现企业移动办公的同时,提供安全稳定快速且性价比高的企业云存储,为企业的高效办公和管理提供助力。  【关键词】移动平台;企业网盘;云存储
期刊
【摘 要】介绍了一种基于Web技术和B,S模式的图书馆公共公务管理系统。该系统能够通过“图书馆公共公务网”网站,向各图书馆提供业务服务。文中给出了系统设计方案和主要功能的实现方法。针对网络图书馆数据库的建立提出了新的数据模型,有效的解决了为多馆服务时数据查询效率和数据存放问题;在与数据库连接时,采用连接池管理技术,进一步提高了数据库访问效率和系统的稳定性;详细分析了系统数据安全问题,提出了安全访问
期刊