• P43

      Hbase教案 文檔

    當你需要對你的大量數據進行隨機近實時讀寫時使用Hbase。HBase的目標是在商用硬件集群上管理非常大的表,數十億行X數百億列。HBase是一個模仿Gootable’s Bigtable的,開源的、分布式的、版本化的非關系型數據庫。Google’s Bigtable是一個由Chang等人創建的一個結構化的分布式存儲系統。正如Bigtable利用谷歌的分布式文件存儲系統,Apache HBase 在Hadoop和HDFS上提供類似Bigtable的功能。

    hz.love 2017-08-03   866   0
    P2

      Hbase列式存儲特性 文檔

    1.稀疏數據:最適合使用Hbase存儲的數據是非常稀疏的數據(非結構化或者半結構化的數據)。因為Hbase是column-oriented列導向的存儲機制。在列導向的存儲機制下對于Null值得存儲是不占用任何空間的。比如,如果某個表UserTable有10列,但在存儲時只有一列有數據,那么其他空值的9列是不占用存儲空間的(普通的數據庫MySql是如何占用存儲空間的呢?)。2.無類型:Hbase適合存儲非結構化的稀疏數據的另一原因是他對列集合columnfamilies處理機制。打個比方,ruby和python這樣的動態語言和c++、java類的編譯語言有什么不同?對于我來說,最顯然的不同就是你不需要為變量預先指定一個類型。Ok,現在Hbase為未來的DBA也帶來了這個激動人心的特性,你只需要告訴你的數據存儲到Hbase的那個columnfamilies就可以了,不需要指定它的具體類型:char,varchar,int,tinyint,text等等。3.Hbase還有很多特性,比如不支持join查詢,但你存儲時可以用:parent-childtuple的方式來變相解決。

    boycott2 2011-05-17   680   0

    關鍵詞

    最新上傳

    熱門文檔

  • sesese色