Hadoop伪分布式搭建操作步骤指南

Hadoop伪分布式搭建操作步骤指南

作者:imxintian 2017-10-25 18:25:40

数据库

大数据

分布式

Hadoop 本文主要分享Hadoop伪分布式搭建的操作步骤,包括准备工作、Hadoop环境部署-JDK部分和Hadoop伪分布式环境部署-Hadoop部分,希望对大家有所帮助。

[[207661]]

一、准备工作

  • 在 /opt/目录下创建文件夹modules,和softwares
    • 修改操作权限(切换至root用户下)
  1. chown -R wxt:wxt /opt/ 
  • 然后切换至普通用户
  1. mkdir softwares 
  2.  
  3. mkdir modules  
  • 安装lrzsz (在linux里可代替ftp上传和下载。)

首先安装lrzsz

  1. yum -y install lrzsz 
  • 上传文件,执行命令rz,会跳出文件选择窗口,选择好文件,点击确认即可。
  1. rz 
  • 下载文件,执行命令sz
  1. sz 

二、Hadoop环境部署-JDK部分

1.

  • 上传jdk 至softwares

2.

  • 解压jdk 至modules
    • tar -zxvf jdk-7u67-linux-x64.tar.gz -C /opt/modules/

3.

  • 修改环境变量
    • 切换至 root 用户修改 vi /etc/profile 文件,配置jdk环境变量
  1. #JAVA_HOME 
  2. export JAVA_HOME=/opt/modules/jdk1.7.0_67 
  3. export PATH=$PATH:$JAVA_HOME/bin  

4.

  •  source /etc/profile 使文件生效
  • 验证是否配置成功
    • java -version
  1. java version "1.7.0_09-icedtea" 
  2. OpenJDK Runtime Environment (rhel-2.3.4.1.el6_3-x86_64) 
  3. OpenJDK 64-Bit Server VM (build 23.2-b09, mixed mode)  
  • jps命令可以查看java 进程
  • echo $JAVA_HOME

三、Hadoop伪分布式环境部署-Hadoop部分

1.

  • 上传文件hadoop-2.5.0.tar.gz,至softwares
  • 解压文件至modules
    • tar -zxvf hadoop-2.5.0.tar.gz -C /opt/modules/

2.

  • 清理Hadoop的目录,将hadoop/share/doc目录删除,节省磁盘空间, 通过这个命令查看df -h

3.

  • 修改hadoop/etc/hadoop/hadoop-env.sh文件
  • 修改hadoop/etc/hadoop/mapred-env.sh文件
  • 修改hadoop/etc/hadoop/yarn-env.sh文件
  • 指定Java安装路径
    • export JAVA_HOME=/opt/modules/jdk1.7.0_67

4.

  • 注意:
    • Hadoop中的四个核心模块对应四个默认配置文件
    • HDFS,Hadoop默认的文件系统,是文件系统的访问入口
    • Namenode,所在的机器9000端口是早期Hadoop 1.x使用的,现在 Hadoop 2.x使用的是8020端口号用于节点直接内部通信,使用RPC通信机制

5.

  • 修改hadoop/etc/hadoop/core-site.xml文件
  1. <property> 
  2.     <name>fs.defaultFS</name
  3.     <!--bigdata-4 为我的localhost 名字--> 
  4.     <value>hdfs://bigdata-4:8020</value> 
  5. </property> 
  6. <property> 
  7.     <name>hadoop.tmp.dir</name
  8.     <value>/opt/modules/hadoop-2.5.0/data/tmp</value> 
  9. </property>  

6.

  • 注意:
    • /tmp表示临时存储目录,系统每次重启会按照脚本预先设置好的删 除 里面的文件重新自定义系统生成的文件路径,/tmp会被清空,无法保证数据文件安全性。

7.

  • 修改hadoop/etc/hadoop/hdfs-site.xml文件
    • 指定HDFS文件存储的副本数个数,默认是3个,这里是单台机器就设置为1,这个数字要小于datanode的节点数。
  1. <property> 
  2.     <name>dfs.replication</name
  3.     <value>1</value> 
  4. </property>  

8.

  • 修改hadoop/etc/hadoop/slaves文件
    • 指定从节点的机器位置,添加主机名即可 
  1. bigdata-4 

9.

  • 格式化namenode
  1. bin/hdfs namenode -format 

10.

  • 启动命令
    • sbin/hadoop-daemon.sh start namenode
    • sbin/hadoop-daemon.sh start datanode

11.

  • 查看HDFS外部UI界面
    • bigdata-04或者IP地址 跟上50070端口号,外部通信http dfs.namenode.http-address 50070
    • http://bigdata-4:50070 (如果windows本地没有配置hosts,需要配置)
    • 如果不能正确打开页面,请检查防火墙是否关闭
      • 切换至root 用户,service iptables status
      • 关闭防火墙 chkconfig iptables off

12.

  • 测试HDFS环境
    • 创建文件夹,HDFS中有用户主目录的概念,和Linux一样
    • bin/hdfs dfs -mkdir -p wxt_test/iuput

13.

  • 上传文件到HDFS(随便找一个文件上传就行)
    • bin/hdfs dfs -put /opt/modules/hadoop-2.5.0/etc/hadoop/core-site.xml wxt_test/input/core-site.xml
    • 上传成功,HDFS外部UI界面,会有上传的文件显示

14.

  • 读取HDFS的文件
    • bin/hdfs dfs -text /core-site.xml
    • 终端会显示上传文件的内容。

15.

  • 下载文件到本地(指定下载到哪里,同时可以重命名成get-site.xml)bin/hdfs dfs -get /core-site.xml /home/wxt/Desktop/get-site.xml然后你会看到这个文件,并且重命名于桌面。

Hadoop 伪分布式搭建至此结束。 

文章来源网络,作者:管理,如若转载,请注明出处:https://shuyeidc.com/wp/298544.html<

(0)
管理的头像管理
上一篇2025-05-22 23:57
下一篇 2025-05-22 23:58

相关推荐

  • 云服务器和云虚拟主机怎么选?云服务器和虚拟主机区别

    云服务器适合业务增长快、需弹性扩展的场景,而云虚拟主机适合预算有限、技术门槛低的小型静态网站或测试环境,二者核心区别在于资源独享性与运维复杂度,核心差异解析:从底层架构到使用体验很多人容易混淆这两者,觉得它们都是“买空间建站”,它们的底层逻辑完全不同,云服务器(ECS)就像是你租了一整栋别墅,水电网络独立,你想……

    2026-06-29
    0
  • 赣州智慧旅游招聘是真的吗?赣州旅游人才招聘信息

    中级岗位(3-5年经验)月薪范围通常在6000-10000元,这类岗位需要独立负责项目模块,如独立运营一个抖音账号,或维护一个景区小程序的功能迭代,具备成功案例的候选人议价能力较强,高级岗位(5年以上经验)月薪范围通常在10000-20000元,部分核心管理岗可达更高,这类人才需要具备战略规划能力,如制定整个景……

    2026-06-29
    0
  • 赣州智能物联网车位锁如何管理?智能车位锁管理系统多少钱

    赣州智能物联网车位锁管理的核心在于通过云端平台实现远程控锁、状态实时监控及自动计费,彻底解决传统车位“被占难管”与“找位难”的痛点,在赣州这样的城市,随着机动车保有量的持续增长,老旧小区、商业综合体以及私人固定车位的资源矛盾日益凸显,传统的机械地锁或简易遥控锁,不仅操作繁琐,更无法实现数据化管理,引入智能物联网……

    2026-06-29
    0
  • 赣州智能消防栓好用吗,智能消防栓多少钱一个

    赣州智能消防栓通过物联网技术实现实时监测与远程报警,能显著降低火灾响应时间并提升城市消防安全管理水平,是目前智慧城市建设中不可或缺的基础设施,赣州智能消防栓的核心价值与应用场景传统消防栓往往存在“看不见、摸不着、用不了”的痛点,在赣州这样地形复杂、老城区与新城区并存的区域,传统设施的管理难度极大,智能消防栓的出……

    2026-06-29
    0
  • 云服务器和物理机到底有啥区别?

    云服务器本质上是虚拟化资源池中的弹性实例,而传统物理服务器是独占的硬件实体,前者胜在弹性与运维便捷,后者强在物理隔离与性能稳定,具体选择取决于业务对成本、扩展性及安全合规的权衡,很多人初次接触服务器时,容易把“云服务器”和“传统物理服务器”混为一谈,觉得它们都是用来跑网站或存数据的盒子,这两者的底层逻辑完全不同……

    2026-06-29
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注