Hbase適合存哪些數據?
一、HBase 基本介紹
HBase 是 BigTable 的開源 Java 版本。是建立在 HDFS 之上,提供高可靠性、高性能、列存儲、可伸縮、實時讀寫 NoSql 的數據庫系統。
它介于 NoSql 和 RDBMS 之間,僅能通過主鍵(row key)和主鍵的 range 來檢索數據,僅支持單行事務(可通過 hive 支持來實現多表 join 等復雜操作),主要用來存儲結構化和半結構化的松散數據。
Hbase 查詢數據功能很簡單,不支持 join 等復雜操作,不支持復雜的事務(行級的事務) Hbase 中支持的數據類型:byte[] 與 hadoop 一樣,Hbase 目標主要依靠橫向擴展,通過不斷增加廉價的商用服務器,來增加計算和存儲能力。
二、HBase 特征簡要
1、海量存儲
Hbase 適合存儲 PB 級別的海量數據,在 PB 級別的數據以及采用廉價 PC 存儲的情況下,能在幾十到百毫秒內返回數據。這與 Hbase 的極易擴展性息息相關。正式因為 Hbase 良好的擴展性,才為海量數據的存儲提供了便利。
2、列式存儲
這里的列式存儲其實說的是列族存儲,Hbase 是根據列族來存儲數據的。列族下面可以有非常多的列,列族在創建表的時候就必須指定。
3、極易擴展
Hbase 的擴展性主要體現在兩個方面,一個是基于上層處理能力(RegionServer)的擴展,一個是基于存儲的擴展(HDFS)。通過橫向添加 RegionSever 的機器,進行水平擴展,提升 Hbase 上層的處理能力,提升 Hbsae 服務更多 Region 的能力。備注:RegionServer 的作用是管理 region、承接業務的訪問,這個后面會詳細的介紹通過橫向添加 Datanode 的機器,進行存儲層擴容,提升 Hbase 的數據存儲能力和提升后端存儲的讀寫能力。
4、高并發
由于目前大部分使用 Hbase 的架構,都是采用的廉價 PC,因此單個 IO 的延遲其實并不小,一般在幾十到上百 ms 之間。這里說的高并發,主要是在并發的情況下,Hbase 的單個IO延遲下降并不多。能獲得高并發、低延遲的服務。
5、稀疏
稀疏主要是針對 Hbase 列的靈活性,在列族中,你可以指定任意多的列,在列數據為空的情況下,是不會占用存儲空間的。
以上就是關于Hbase的知識希望對大家有幫助。

相關推薦HOT
更多>>
在 iPad 上運行 Windows 是什么體驗?
一、在 iPad 上運行 Windows 是什么體驗目前市面上有一些能夠在 iPad 上運行 Windows 的應用程序,例如 Parallels Access、Splash較好、VMware ...詳情>>
2023-10-14 19:14:27
vector, list, map等容器使用場合是什么?
一、vector, list, map等容器使用場合vector適用于對象簡單,變化較小,并且頻繁隨機訪問的場景。list適用經常進行插入和刪除并且不經常隨機訪...詳情>>
2023-10-14 14:59:11
分庫分表的數據庫和分布式數據庫有什么區別?
一、分庫分表的數據庫和分布式數據庫有什么區別分庫分表的數據庫:沒有這種數據庫,所謂分庫分表,這是開發應用的程序員通過自己的代碼、或者底...詳情>>
2023-10-14 13:59:18
APP定制開發的難點有哪些?
一、APP定制開發的難點1、多平臺適配不同的移動平臺(如iOS和Android)具有不同的操作系統、開發語言和開發工具。在進行APP定制開發時,需要適...詳情>>
2023-10-14 12:57:35