| 企服解答
hbase的特點有:1、海量存儲;2、列式存儲;3、極易擴展;4、高并發(fā);5、稀疏;6、數(shù)據(jù)的多版本;7、數(shù)據(jù)類型單一。
hbase的特點
HBase的特點:
1、海量存儲:可以存儲大批量的數(shù)據(jù)。
2、列(簇)式存儲:hbase表的數(shù)據(jù)是基于列族進行存儲的,列族是在列的方向上的劃分。
3、極易擴展:底層依賴HDFS,當磁盤空間不足的時候,只需要動態(tài)增加 datanode節(jié)點服務(wù)(機器)就可以了;可以通過增加服務(wù)器來提高集群的存儲能力。
4、高并發(fā):支持高并發(fā)的讀寫請求。
5、稀疏:稀疏主要是針對Hbase列的靈活性,在列族中,你可以指定任意多的列,在列數(shù)據(jù)為空的情況下,是不會占用存儲空間的。
6、數(shù)據(jù)的多版本:hbase表中的數(shù)據(jù)可以有多個版本值,默認情況下是根據(jù)版本號去區(qū)分,版本號就是插入數(shù)據(jù)的時間戳。
7、數(shù)據(jù)類型單一:所有的數(shù)據(jù)在hbase中是以字節(jié)數(shù)組進行存儲。
| 擴展閱讀
HBase 基于 Google 的 BigTable 論文的開源實現(xiàn),是建立的 HDFS之上,提供高可靠性、高性能、列存儲、可伸縮、實時讀寫的分布式數(shù)據(jù)庫系統(tǒng)。
HBase與傳統(tǒng)的關(guān)系數(shù)據(jù)庫的區(qū)別:
1、數(shù)據(jù)類型:
關(guān)系數(shù)據(jù)庫采用關(guān)系模型,具有豐富的數(shù)據(jù)類型和存儲方式,HBase則采用了更加簡單的數(shù)據(jù)模型,它把數(shù)據(jù)存儲為未經(jīng)解釋的字符串。
2、數(shù)據(jù)操作:
關(guān)系數(shù)據(jù)庫中包含了豐富的操作,其中會涉及復(fù)雜的多表連接。HBase操作則不存在復(fù)雜的表與表之間的關(guān)系,只有簡單的插入、查詢、刪除、清空等,因此HBase在設(shè)計上就避免了復(fù)雜的表和表之間的關(guān)系。
3、存儲模式:
關(guān)系數(shù)據(jù)庫是基于行模式存儲的。HBase是基于列存儲的,每個列族都由幾個文件保存,不同列族的文件是分離的。
4、數(shù)據(jù)索引:
關(guān)系數(shù)據(jù)庫通常可以針對不同列構(gòu)建復(fù)雜的多個索引,以提高數(shù)據(jù)訪問性能。HBase只有一個索引——行鍵,通過巧妙的設(shè)計,HBase中的所有訪問方法,或者通過行鍵訪問,或者通過行鍵掃描,從而使得整個系統(tǒng)不會慢下來。
5、數(shù)據(jù)維護:
在關(guān)系數(shù)據(jù)庫中,更新操作會用最新的當前值去替換記錄中原來的舊值,舊值被覆蓋后就不會存在。而在HBase中執(zhí)行更新操作時,并不會刪除數(shù)據(jù)舊的版本,而是生成一個新的版本,舊有的版本仍然保留。
6、可伸縮性:
關(guān)系數(shù)據(jù)庫很難實現(xiàn)橫向擴展,縱向擴展的空間也比較有限。相反,HBase和BigTable這些分布式數(shù)據(jù)庫就是為了實現(xiàn)靈活的水平擴展而開發(fā)的,能夠輕易地通過在集群中增加或者減少硬件數(shù)量來實現(xiàn)性能的伸縮。
[免責聲明]
文章標題: hbase的特點
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學習與參考,不代表本網(wǎng)站贊同其觀點和對其真實性負責。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內(nèi)處理。