浅析Hbase中的Hadoop单机环境配置

HBase是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式。HBase使用和Bigtable非常相同的数据模型。用户存储数据行在一个表里。一个数据行拥有一个可选择的键和任意数量的列。表是疏松的存储的,因此用户可以给行定义各种不同的列。HBase主要用于需要随机访问,实时读写你的大数据(Big Data)。

 

本文主要介绍在Ubuntu10.04环境下安装配置单机版原生的HBase。在网络上找到的文章要么语焉不详,要么ungeliable.于是记录一下自己的安装配置过程,做个STEP BY STEP的图文并茂的教程,谨防自己以后忘记 。

向您推荐《Facebook实时信息系统:HBase每月存储1350亿条信息

安装Hbase其实主要是配置好java环境以及Hadoop与Hbase的配置文件。

1.安装并配置Java环境。在Ubuntu10.04默认的源使用的OpenJDK,在某些应用上OpenJDK并不被支持(如abicloud等).我们为了省事还是安装sun java ,打开终端,输入以下命令:

(1)安装 

  1. sudo add-apt-repository "deb http://archive.canonical.com/ lucid partner"   
  2. sudo apt-get update    
  3. sudo apt-get install sun-java6-jre sun-java6-plugin sun-java6-fonts    
  4. sudo apt-get install sun-java6-jdk sun-java6-plugin sun-java6-fonts  

查看是否安装成功

  1. $ java -version  

(2) 设置默认的java解释器。

  1. sudo update-alternatives --config java  

会出现下列图面:

输入你想选择的编号。

(3)编辑java环境变量

  1. sudo gedit /etc/environment  

在弹出的environment文件中添加下列两行:

CLASSPATH=.:/usr/lib/jvm/java-6-sun/lib  JAVA_HOME=/usr/lib/jvm/java-6-sun

保存退出,行文至此,java环境已经配置好。

2.安装并配置Hadoop。虽说我安装的是单机版的Hbase,但是由于Hadoop本来就是分布系统,使用SSH通讯。

(1)安装ssh

  1. sudo apt-get install ssh  

(2)设置不用登录密码

  1. <PRE class=wiki>$ ssh-keygen -t rsa -f ~/.ssh/id_rsa -P ""</PRE>    
  2. <PRE class=wiki>$ cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys</PRE>  

完成后登录不用输入密码,***次需要输入回车键。        

  1. $ ssh localhost    
  2. $ exit    
  3. $ ssh localhost    
  4. $ exit  

 (3)下载解压Hadoop,到http://hadoop.apache.org/common/releases.html#Download下载stable版本0.20.2.并解压到/Home路径

(4)修改hadoop-env.sh 。在本人机器上解压路径是/home/viki/hadoop-0.20.2,进入刚才所解压的文件夹,修改之(需要root权限)。

  1. cd hadoop-0.20.2   
  2. gedit conf/hadoop-env.sh  

将以下java环境copy进去。

  1. export JAVA_HOME=/usr/lib/jvm/java-6-sun-1.6.0.22  

(5)设置xml文件,需要设置conf文件夹下的三个文件core-site.xml, hdfs-site.xml, mapred-site.xml。

  1. gedit  conf/core-site.xml  

将下面内容copy进该文件中:

  1. <configuration>    
  2. <property>    
  3. <name>fs.default.name</name>    
  4.  <value>hdfs://localhost:9000</value>    
  5.  </property>    
  6.  <property>    
  7.  <name>hadoop.tmp.dir</name>    
  8.   <value>/var/hadoop/hadoop-\${user.name}</value>    
  9. </property>    
  10.  </configuration>  

保存退出,继续修改另外一个文件hdfs-site.xml

  1. gedit  conf/hdfs-site.xml  

将下面内容copy进该文件

  1. <configuration>    
  2. <property>    
  3.    <name>dfs.replication</name>    
  4.  <value>1</value>    
  5.  </property>    
  6. </configuration>  

保存退出,修改***一个文件 

  1. gedit mapred-site.xml  

将下面内容copy进该文件

  1. <configuration>    
  2.   <property>    
  3.     <name>mapred.job.tracker</name>    
  4.    <value>localhost:9001</value>    
  5.   </property>    
  6.  </configuration>  

经历以上步骤,所有文件修改完毕,已经设置好Hadoop单机测试环境,下面将是启动Hadoop服务。

3.格式化Namenode并开启所有Hadoop服务,查看服务状态。

(1)格式化Namenode

  1. bin/hadoop namenode -format  

会出现下面画面:

(2)启动所有Hadoop服务

  1. bin/start-all.sh  

会出现下面画面:


(3)查看服务状态。

管理页面:http://localhost:50030/jobtracker.jsp

原文链接:http://www.cnblogs.com/ventlam/archive/2010/11/24/hadoop.html

 

  1. Facebook实时信息系统:HBase每月存储1350亿条信息
  2. SQL Server数据库对大数据量表数据进行DELETE
  3. MongoDB CEO谈NoSQL的大数据量处理能力
  4. 详解NoSQL数据库使用实例
  5. 细数Google HBase与BigTable区别在哪里?

【编辑推荐】

文章来源网络,作者:管理,如若转载,请注明出处:https://shuyeidc.com/wp/301071.html<

(0)
管理的头像管理
上一篇2025-05-24 04:08
下一篇 2025-05-24 04:10

相关推荐

  • 云服务器和云虚拟主机怎么选?云服务器和虚拟主机区别

    云服务器适合业务增长快、需弹性扩展的场景,而云虚拟主机适合预算有限、技术门槛低的小型静态网站或测试环境,二者核心区别在于资源独享性与运维复杂度,核心差异解析:从底层架构到使用体验很多人容易混淆这两者,觉得它们都是“买空间建站”,它们的底层逻辑完全不同,云服务器(ECS)就像是你租了一整栋别墅,水电网络独立,你想……

    2026-06-29
    0
  • 赣州智慧旅游招聘是真的吗?赣州旅游人才招聘信息

    中级岗位(3-5年经验)月薪范围通常在6000-10000元,这类岗位需要独立负责项目模块,如独立运营一个抖音账号,或维护一个景区小程序的功能迭代,具备成功案例的候选人议价能力较强,高级岗位(5年以上经验)月薪范围通常在10000-20000元,部分核心管理岗可达更高,这类人才需要具备战略规划能力,如制定整个景……

    2026-06-29
    0
  • 赣州智能物联网车位锁如何管理?智能车位锁管理系统多少钱

    赣州智能物联网车位锁管理的核心在于通过云端平台实现远程控锁、状态实时监控及自动计费,彻底解决传统车位“被占难管”与“找位难”的痛点,在赣州这样的城市,随着机动车保有量的持续增长,老旧小区、商业综合体以及私人固定车位的资源矛盾日益凸显,传统的机械地锁或简易遥控锁,不仅操作繁琐,更无法实现数据化管理,引入智能物联网……

    2026-06-29
    0
  • 赣州智能消防栓好用吗,智能消防栓多少钱一个

    赣州智能消防栓通过物联网技术实现实时监测与远程报警,能显著降低火灾响应时间并提升城市消防安全管理水平,是目前智慧城市建设中不可或缺的基础设施,赣州智能消防栓的核心价值与应用场景传统消防栓往往存在“看不见、摸不着、用不了”的痛点,在赣州这样地形复杂、老城区与新城区并存的区域,传统设施的管理难度极大,智能消防栓的出……

    2026-06-29
    0
  • 云服务器和物理机到底有啥区别?

    云服务器本质上是虚拟化资源池中的弹性实例,而传统物理服务器是独占的硬件实体,前者胜在弹性与运维便捷,后者强在物理隔离与性能稳定,具体选择取决于业务对成本、扩展性及安全合规的权衡,很多人初次接触服务器时,容易把“云服务器”和“传统物理服务器”混为一谈,觉得它们都是用来跑网站或存数据的盒子,这两者的底层逻辑完全不同……

    2026-06-29
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注