CentOS 6.9下Hadoop伪分布式环境搭建

栏目: 编程工具 · 发布时间: 9年前

内容简介：CentOS 6.9下Hadoop伪分布式环境搭建

环境：CentOS6.9+jdk+Hadoop

1.下载hadoop的tar包，这里以hadoop2.6.5版本为例，下载地址https://archive.apache.org/dist/hadoop/common/hadoop-2.6.5/hadoop-2.6.5.tar.gz

2.修改 linux 虚拟机的主机名为hadoop01.zjl.com

# vi /etc/sysconfig/network

NETWORKING=yes

HOSTNAME=hadoop01.zjl.com

3.配置主机名和IP地址的映射

# vi /etc/hosts

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.0.131 hadoop01.zjl.com hadoop01

4.重启虚拟机，是步骤2、3的配置生效

# reboot

5.在物理机的hosts文件中配置192.168.0.131 hadoop01.zjl.com hadoop01，我的物理机是win10 64位操作系统，hosts文件的位置是C:\Windows\System32\drivers\etc\hosts

6.（1）执行# rpm -qa|grep java，发现虚拟机中没装过jdk，如果装过可以用# rpm -e --nodeps来卸载

（2）jdk安装包没有执行权限

# ll jdk-8u131-linux-x64.tar.gz

-rw-rw-r--. 1 hadoop hadoop 185540433 May 20 22:57 /opt/softwares/jdk-8u131-linux-x64.tar.gz

（3）给安装包授予执行权限

$ chmod u+x jdk-8u131-linux-x64.tar.gz

（4）解压安装

$ tar -zxvf jdk-8u131-linux-x64.tar.gz -C /opt/modules/

7.配置环境变量

# vi /etc/profile

# set java environment

export JAVA_HOME=/opt/modules/jdk1.8.0_131

export PATH=$PATH:$JAVA_HOME/bin

使环境变量的配置生效

# source /etc/profile

jdk配置没问题了

# java -version

java version "1.8.0_131"

Java(TM) SE Runtime Environment (build 1.8.0_131-b11)

Java HotSpot(TM) 64-Bit Server VM (build 25.131-b11, mixed mode)

8.解压hadoop安装包

$ tar -zxvf hadoop-2.6.5.tar.gz -C /opt/modules/

9.在etc/hadoop/hadoop-env.sh文件中设置JAVA_HOME

export JAVA_HOME=/opt/modules/jdk1.8.0_131

10.默认情况下，Hadoop配置为以非分布式模式运行，作为单个 Java 进程，

本地模式：mapreduce程序运行在本地，只需启动JVM

以下示例复制未打包的conf目录以用作输入，然后查找并显示给定正则表达式的每个匹配项。输出被写入给定的输出目录。

$ mkdir input

$ cp etc/hadoop/*.xml input

$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar grep input output 'dfs[a-z.]+'

$ cat output/*

依次执行上述命令后如果没有报错，且cat output/*命令的结果为1 dfsadmin，则说明mapreduce程序运行成功

11.hadoop xml配置

etc/hadoop/core-site.xml:

<name>fs.defaultFS</name>

<value>hdfs://hadoop01.zjl.com:9000</value>

</property>

<name>hadoop.tmp.dir</name>

<value>/opt/modules/hadoop-2.6.5/data/tmp</value>

</property>

</configuration>

[hadoop@hadoop01 hadoop-2.6.5]$ mkdir -p data/tmp

etc/hadoop/hdfs-site.xml:

<name>dfs.replication</name>

</property>

</configuration>

12.执行

（1）格式化文件系统：

[hadoop@hadoop01 hadoop-2.6.5]$ bin/hdfs namenode -format

（2）启动NameNode守护进程和DataNode守护进程：

[hadoop@hadoop01 hadoop-2.6.5]$ sbin/start-dfs.sh

（3）执行jps命令查询java守护进程，若出现NameNode，DataNode，SecondaryNameNode，则启动成功

[hadoop@hadoop01 hadoop-2.6.5]$ jps

5296 Jps

4902 NameNode

5016 DataNode

5178 SecondaryNameNode

（4）在浏览器地址栏输入http://hadoop01.zjl.com:50070,回车，出现下图所示页面

CentOS 6.9下Hadoop伪分布式环境搭建

13.单节点上的YARN的配置

（1）在etc/hadoop/yarn-env.sh文件中配置export JAVA_HOME=/opt/modules/jdk1.8.0_131

（2）

etc/hadoop/yarn-site.xml:

<name>yarn.resourcemanager.hostname</name>

<value>hadoop01.zjl.com</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

（3）将etc/hadoop/slaves文件中的localhost换成主机名hadoop01.zjl.com

（4）启动ResourceManager守护程序和NodeManager守护程序：

[hadoop@hadoop01 hadoop-2.6.5]$ sbin/start-yarn.sh

执行jps命令，出现了NodeManager和NameNode进程，说明yarn启动成功

[hadoop@hadoop01 hadoop-2.6.5]$ jps

6851 NodeManager

4902 NameNode

7158 Jps

5016 DataNode

5178 SecondaryNameNode

6763 ResourceManager

（5）在浏览器地址栏输入http://hadoop01.zjl.com:8088/cluster，回车，出现下图所示页面

CentOS 6.9下Hadoop伪分布式环境搭建

14.使Mapreduce能够在yarn上运行

（1）在etc/hadoop/mapred-env.sh文件中配置export JAVA_HOME=/opt/modules/jdk1.8.0_131

（2）将etc/hadoop/mapred-site.xml.template重命名为mapred-site.xml，添加配置

<name>mapreduce.framework.name</name>

</property>

</configuration>

Hadoop2.3-HA高可用集群环境搭建 http://www.linuxidc.com/Linux/2017-03/142155.htm

Hadoop项目之基于CentOS7的Cloudera 5.10.1（CDH）的安装部署 http://www.linuxidc.com/Linux/2017-04/143095.htm

Hadoop2.7.2集群搭建详解（高可用） http://www.linuxidc.com/Linux/2017-03/142052.htm

使用Ambari来部署Hadoop集群（搭建内网HDP源） http://www.linuxidc.com/Linux/2017-03/142136.htm

Ubuntu 14.04下Hadoop集群安装 http://www.linuxidc.com/Linux/2017-02/140783.htm

更多Hadoop相关信息见 Hadoop 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=13

本文永久更新链接地址 ： http://www.linuxidc.com/Linux/2017-06/144884.htm

以上所述就是小编给大家介绍的《CentOS 6.9下Hadoop伪分布式环境搭建》，希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对码农网的支持！

查看所有标签

本站部分资源来源于网络，本站转载出于传递更多信息之目的，版权归原作者或者来源机构所有，如转载稿涉及版权问题，请联系我们。

码农书籍

Professional JavaScript for Web Developers

Nicholas C. Zakas / Wrox / 2009-1-14 / USD 49.99

This eagerly anticipated update to the breakout book on JavaScript offers you an in-depth look at the numerous advances to the techniques and technology of the JavaScript language. You'll see why Java......一起来看看《Professional JavaScript for Web Developers》这本书的介绍吧!

码农工具

CentOS 6.9下Hadoop伪分布式环境搭建

Professional JavaScript for Web Developers

MD5 加密

Markdown 在线编辑器

正则表达式在线测试