更新時(shí)間:2020年12月17日10時(shí)40分 來(lái)源:傳智教育 瀏覽次數(shù):
HBase分布式數(shù)據(jù)庫(kù)最重要的就是存儲(chǔ)數(shù)據(jù),下面,從四個(gè)方面詳細(xì)介紹HBase的物理存儲(chǔ)。
1.HBase表的數(shù)據(jù)按照行鍵RowKey的字典序進(jìn)行排列,并且切分多個(gè)HRegion存儲(chǔ),存儲(chǔ)方式如圖1所示。
? 圖1 Region在行方向上的存儲(chǔ)
2.每個(gè)Region存儲(chǔ)的數(shù)據(jù)是有限的,如果當(dāng)Region增大到一個(gè)閥值(128)時(shí),會(huì)被等分切成兩個(gè)新的Region,切分方式如圖2所示。
? 圖2 HRegion的切分
3.一個(gè)HRegion Server上可以存儲(chǔ)多個(gè)Region,但是每個(gè)Region只能被分布到一個(gè)HRegion Server上,分布方式如圖3所示。
圖3 HRegion的分布
4.MemStore中存儲(chǔ)的是用戶寫入的數(shù)據(jù),一旦MemStore存儲(chǔ)達(dá)到閾值時(shí),里面存儲(chǔ)的數(shù)據(jù)就會(huì)被刷新到新生成的StoreFile中(底層是HFile),該文件是以HFile的格式存儲(chǔ)到HDFS上,具體如圖4所示。
? 圖4 HBase表的存儲(chǔ)
猜你喜歡:
HDFS讀寫流程介紹,HDFS讀數(shù)據(jù)和寫數(shù)據(jù)的原理是什么?
2020-12-01MapReduce程序怎樣設(shè)置本地運(yùn)行模式?
2020-12-01Scala算術(shù)操作符重載怎樣使用?
2020-11-18大數(shù)據(jù)的兩種計(jì)算框架優(yōu)劣對(duì)比,哪個(gè)更適合開發(fā)?
2020-11-18如何操作MapReduce的性能調(diào)優(yōu)?
2020-11-18HBase表常見Shell命令及具體語(yǔ)法操作講解【大數(shù)據(jù)文章】
2020-11-17北京校區(qū)