hbase是什么意思?
HBase是一个分布式、面向列的开源数据库。这项技术来自Fay Chang撰写的Google论文“Bigtable:结构化数据的分布式存储系统”。
就像Bigtable利用Google文件系统提供的分布式数据存储一样,HBase在Hadoop上提供了与Bigtable类似的功能。
HBase是Apache Hadoop项目的子项目。HBase不同于一般的关系型数据库,它是一种适合非结构化数据存储的数据库。另一个区别是HBase基于列而不是行。
结构介绍:
h base–Hadoop数据库是一个高可靠性、高性能、面向列且可扩展的分布式存储系统。使用HBase技术,可以在廉价的PC服务器上构建大规模结构化存储集群。
与富士通Cliq等商业大数据产品不同,HBase是Google Bigtable的开源实现,类似于Google Bigtable使用GFS作为文件存储系统,HBase使用Hadoop HDFS作为文件存储系统;
Google运行MapReduce处理Bigtable中的海量数据,HBase也使用Hadoop MapReduce处理HBase中的海量数据;Google Bigtable使用Chubby作为协作服务,HBase使用Zookeeper作为对应服务。?
上图描述了Hadoop生态系统的各个层面。其中HBase位于结构化存储层,Hadoop HDFS为HBase提供高可靠的底层存储支持,Hadoop MapReduce为HBase提供高性能计算能力,Zookeeper为HBase提供稳定的服务和故障转移机制。
此外,Pig和Hive还为HBase提供了高级语言支持,使得在HBase上处理数据统计变得非常简单。Sqoop为HBase提供了便捷的RDBMS数据导入功能,使得传统数据库数据迁移到HBase非常方便。