Hadoop 系列文章(一) Hadoop 的安装,以及 Standalone Operation 的启动模式测试
发布日期:2021-08-13 22:07:57 浏览次数:6 分类:技术文章

本文共 3086 字,大约阅读时间需要 10 分钟。

  以前都是玩 java,没搞过 hadoop,所以以此系列文章来记录下学习过程

  安装的文件版本、操作系统说明

centos-6.5-x86_64[bamboo@hadoop-senior opt]$ uname -aLinux hadoop-senior.bamboo.com 2.6.32-696.16.1.el6.x86_64  

  jdk、hadoop

[bamboo@hadoop-senior softwares]$ lltotal 443172-rw-r--r--. 1 bamboo bamboo 311430119 Dec 29 23:52 hadoop-2.5.0.tar.gz-rw-r--r--. 1 bamboo bamboo 142376665 Dec 30 02:17 jdk-7u67-linux-x64.tar.gz

 

 

  • 1. 在 opt 目录下创建 4 个目录:
[bamboo@hadoop-senior opt]$ lltotal 20drwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 datasdrwxr-xr-x. 4 bamboo bamboo 4096 Dec 30 18:32 modulesdrwxr-xr-x. 2 root root 4096 Oct 3 22:14 rhdrwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:16 softwaresdrwxr-xr-x. 2 bamboo bamboo 4096 Dec 30 18:05 tools

  

  •  2.安装前先检查下 java 
  
rpm -qa | grep java如果有的话,会返回一系列的内容,[bamboo@hadoop-senior opt]$ rpm -qa | grep java [bamboo@hadoop-senior opt]$可以看到我的机器是是没有的,如果返回有记录的话,则执行如下的命令rpm -e --nodeps 1 2 3(1 2 3 是执行命令返回的结果集)
 
 
  •   3.安装 java
  
3.1 解压 jdk  tar -zxvf jdk*.tar.gz -C /opt/modules   3.2 配置环境变量  vim /etc/profile   在最后添加如下的配置  export JAVA_HOME=/opt/modules/jdk1.7.0_67  export PATH=$PATH:$JAVA_HOME/bin   保存退出   3.3 生效配置  source /etc/profile  这样即可生效   3.4 验证 java 是否安装成功  [bamboo@localhost jdk1.7.0_67]$ java -version  java version "1.7.0_67"  Java(TM) SE Runtime Environment (build 1.7.0_67-b01)  Java HotSpot(TM) 64-Bit Server VM (build 24.65-b04, mixed mode)  可以看到已经生效
 
  • 4.安装 hadoop
  
4.1 解压 hadooptar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/ 4.2 配置 hadoop-env.sh 环境变量/opt/modules/hadoop-2.5.0/etc/hadoop/hadoop-env.shvim hadoop-env.sh配置 jdk 路径export JAVA_HOME=/opt/modules/jdk1.7.0_67 4.3 启动 hadoop (有 3 种启动方式) 4.3.1 切换到安装根目录,然后创建 input 目录[bamboo@localhost hadoop-2.5.0]$ pwd/opt/modules/hadoop-2.5.0[bamboo@localhost hadoop-2.5.0]$ mkdir input[bamboo@localhost hadoop-2.5.0]$ lsbin etc include input lib libexec sbin share 4.3.2 把 etc/hadoop 下的 xml 文件 cp 到 input 目录下[bamboo@localhost hadoop-2.5.0]$ cp etc/hadoop/*.xml input/[bamboo@localhost hadoop-2.5.0]$ cd input/[bamboo@localhost input]$ lscapacity-scheduler.xml core-site.xml hadoop-policy.xml hdfs-site.xml httpfs-site.xml yarn-site.xml 4.3.3 启动 hadoopbin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar grep input output 'dfs[a-z.]+'执行成功,并没有报错执行 ls,可以看到多了 output目录:[bamboo@localhost hadoop-2.5.0]$ lsbin etc include input lib libexec output sbin share[bamboo@localhost hadoop-2.5.0]$ cat output/*1 dfsadmin 测试一个统计字符的mkdir wcinputvim wcinputhadoop yarnhadoop mapreducehadoop hdfsyarn nodemanagerhadoop resourcemanager 然后启动 hadoop:[bamboo@localhost hadoop-2.5.0]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount wcinput wcoutput [bamboo@localhost hadoop-2.5.0]$ cat wcoutput/*hadoop 4hdfs 1mapreduce 1nodemanager 1resourcemanager 1yarn 2[bamboo@localhost hadoop-2.5.0]$ cat wcinput/cat: wcinput/: Is a directory[bamboo@localhost hadoop-2.5.0]$ cat wcinput/*hadoop yarnhadoop mapreducehadoop hdfsyarn nodemanagerhadoop resourcemanager
 
这个模式是 hadoop 的 Standalone Operation 启动模式.下一篇继续 Pseudo-Distributed Mode.
 
当然也可以参考官网的 getstart 文档,链接如下:

转载于:https://www.cnblogs.com/zhuzi91/p/8158875.html

转载地址:https://blog.csdn.net/weixin_30699831/article/details/98346237 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:bzoj 1041: [HAOI2008]圆上的整点
下一篇:nohup不挂断地运行

发表评论

最新留言

逛到本站,mark一下
[***.202.152.39]2024年03月27日 02时39分34秒