在 Centos7 下使用 Docker 快速搭建 Hadoop 集群
发布日期:2021-06-30 16:51:07 浏览次数:2 分类:技术文章

本文共 1291 字,大约阅读时间需要 4 分钟。

一、前言

按传统方法,能否在服务器上,能否成功搭建 hadoop 集群,取决于配置是否配置成功

在习惯优于配置的时代,已然过时
使用 docker 技术,零配置,10 秒内轻松搭建 hadoop 集群
本文图文并茂,轻松阅读无障碍

二、环境搭建

主要使用的镜像:

阿里云镜像的,云服务器若也是阿里云的,拉去的速度将十分惊人

2.1.拉取镜像

docker pull registry.aliyuncs.com/kaibb/hadoop

这里写图片描述

可以使用 docker images 查看镜像是否存在

2.2.启动容器

docker run -itd --name hadoop -h hadoop -P registry.aliyuncs.com/kaibb/hadoop

这里写图片描述

先使用 docker ps 查看端口映射,后面要在网页访问 DFS、YARN 要分别用到 50070、8088 端口的映射!!
这里写图片描述
使用 docker ps -a 查看各个容器运行的状态

2.3.进入容器

docker exec -it hadoop bash

这里写图片描述

2.4.格式化 namenode

在任何目录下运行 hadoop 命令都可以

hadoop namenode -format

这里写图片描述

输出了一堆很长的日志。。。

2.5.运行 DFS

start-dfs.sh

中间输入两个 yes,不要输入错误 ~

这里写图片描述
之后可以使用 jps 查看节点

访问

(① 改120.79.197.130为你的服务器ip、② 改32802为你的 50070映射端口、③ 云服务器注意开启安全组)
进入如下页面,说明一切顺利
这里写图片描述

2.6.运行 YARN

start-yarn.sh

这里写图片描述

之后可以再次使用 jps 查看新节点

访问 进入如下页面,说明一切顺利

(① 改120.79.197.130为你的服务器ip、② 改32807为你的 8088 映射端口、③ 云服务器注意开启安全组)
这里写图片描述

三、其他操作

3.1.更换目录

cd /opt/tools/hadoop

这里写图片描述

3.2.创建文件夹

hdfs dfs -mkdir -p /user/kaibb/input

这里写图片描述

可以使用 hdfs dfs -ls /user/kaibb 查看刚刚创建的目录

3.3.复制文件至dfs文件目录中

hdfs dfs -put /opt/tools/hadoop/etc/hadoop/* /user/kaibb/input

这里写图片描述

可以使用 hdfs dfs -ls /user/kaibb/input 查看 dfs文件目录下的内容
也可以在网页直接查看,点击红色框中的内容:
这里写图片描述
如下:
这里写图片描述

3.4.运行示例程序

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep /user/kaibb/input output 'dfs[a-z.]+'

这里写图片描述

在 YARN 中可以看到运行成功的两个应用:
这里写图片描述

3.5.查看结果、节点

hdfs dfs -cat output/*
jps

这里写图片描述

四、MapReduce

测试程序:

转载地址:https://larger5.blog.csdn.net/article/details/81153699 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Python web 框架 Flask 蓝图的正确使用姿势
下一篇:[Python爬虫] 使用 Beautiful Soup 4 快速爬取所需的网页信息

发表评论

最新留言

做的很好,不错不错
[***.243.131.199]2024年04月26日 15时23分03秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章