leveldb性能分析和表現
Leveldb是一個google實現的非常高效的kv數據庫,目前的版本1.2能夠支持billion級別的數據量了。 在這個數量級別下還有著非常高的性能,主要歸功于它的良好的設計。特別是LSM算法。
那么數據庫最怕的的隨機IO他是如何解決的呢?
先說隨機寫,它的寫都是先記錄到日志文件去的,在日志文件滿之前只是簡單的更新memtable,那么就把隨機寫轉化成了順序寫。在日志滿了后,把日志里面的數據排序寫成sst表同時和之前的sst進行合并,這個動作也是順序讀和寫。大家都知道傳統磁盤raid的順序讀寫吞吐量是很大的,100M左右是沒有問題。在寫日志文件的時候,用到是buffer IO,也就是說如果操作系統有足夠的內存,這個讀寫全部由操作系統緩沖,效果非常好。即使是sync寫模式,也是以數據累計到4K為一個單位寫的,所以效率高。
那么隨機讀呢?這個它解決不了。但是ssd盤最擅長隨機讀了。這個硬件很自然的解決了這個問題。
所以leveldb的絕配是ssd盤的raid.
leveldb標準版本編譯見這里,由于標準版本用到了c++ 0x的特性,在RHEL平臺下沒得到支持,所以為了移植性, basho見這里為它做了標準c++版本的port, 見目錄c_src/leveldb. 他之所以用c++ 0x標準主要是用到里面的原子庫,basho的port用了libatomicops搞定這個問題.
我們的測試采用的就是這個版本, 我們分別測試了1000萬, 1億,10億數據量下的leveldb表現,發現隨著數據集的變化性能變化不大。
由于leveldb默認的sst文件是2M, 在數據集達到100G的時候要占用幾萬個文件,我修改了:
<DIV id=highlighter_33052 class="syntaxhighlighter nogutter cpp">
version_set.cc:23 static const int kTargetFileSize = 32 * 1048576; |
讓默認的文件變成32M,減少目錄的壓力。
我的測試環境是:
top說:
21782 root 18 0 1273m 1.1g 2012 R 85.3 1.2 1152:34 db_bench |
iostat說:
sdb1 0.40 0.00 3.40 0.00 30.40 0.00 8.94 0.02 4.65 4.65 1.58 |
fioa 0.00 0.00 2074.80 3.80 16598.40 30.40 8.00 0.00 0.13 0.00 0.00 |
dm-0 0.00 0.00 1600.00 0.00 16630.40 0.00 10.39 0.25 0.15 0.15 24.76 |
該測試中請注意snappy壓縮沒有打開,如果有壓縮性能還會高很多,因為IO少了一半。
write_buffer_size=$((256*1024*1024)),log大小設成256M,這樣減少切換日志的開銷和減少數據合并的頻率。
同時應該注意到db_bench是單線程程序,還有一個compact線程,所以最多的時候這個程序只能跑到200%的cpu, IO util也不是很高. 換句話說如果是多線程程序的話性能還要N倍的提高。
我們來看下實際的性能數字:
$ sudo ./db_bench --num=10000000 --write_buffer_size=$((256*1024*1024)) |
Date: Fri May 27 17:14:33 2011 |
CPU: 24 * Intel(R) Xeon(R) CPU X5670 @ 2.93GHz |
Values: 100 bytes each (50 bytes after compression) |
RawSize: 1106.3 MB (estimated) |
FileSize: 629.4 MB (estimated) |
write_buffer_size=268435456 |
WARNING: Snappy compression is not enabled |
------------------------------------------------ |
fillseq : 2.134 micros/ op ; 51.8 MB/s |
fillsync : 70.722 micros/ op ; 1.6 MB/s (100000 ops) |
fillrandom : 5.229 micros/ op ; 21.2 MB/s |
overwrite : 5.396 micros/ op ; 20.5 MB/s |
readrandom : 65.729 micros/ op ; |
readrandom : 43.086 micros/ op ; |
readseq : 0.882 micros/ op ; 125.4 MB/s |
readreverse : 1.200 micros/ op ; 92.2 MB/s |
compact : 24599514.008 micros/ op ; |
readrandom : 12.663 micros/ op ; |
readseq : 0.372 micros/ op ; 297.4 MB/s |
readreverse : 0.559 micros/ op ; 198.0 MB/s |
fill100K : 349.894 micros/ op ; 272.6 MB/s (10000 ops) |
crc32c : 4.759 micros/ op ; 820.8 MB/s (4K per op ) |
snappycomp : 3.099 micros/ op ; (snappy failure) |
snappyuncomp : 2.146 micros/ op ; (snappy failure) |
$ sudo ./db_bench --num=100000000 --write_buffer_size=$((256*1024*1024)) |
Date: Fri May 27 17:39:19 2011 |
CPU: 24 * Intel(R) Xeon(R) CPU X5670 @ 2.93GHz |
Values: 100 bytes each (50 bytes after compression) |
RawSize: 11062.6 MB (estimated) |
FileSize: 6294.3 MB (estimated) |
write_buffer_size=268435456 |
WARNING: Snappy compression is not enabled |
------------------------------------------------ |
fillseq : 2.140 micros/ op ; 51.7 MB/s |
fillsync : 70.592 micros/ op ; 1.6 MB/s (1000000 ops) |
fillrandom : 6.033 micros/ op ; 18.3 MB/s |
overwrite : 7.653 micros/ op ; 14.5 MB/s |
readrandom : 44.833 micros/ op ; |
readrandom : 43.963 micros/ op ; |
readseq : 0.561 micros/ op ; 197.1 MB/s |
readreverse : 0.809 micros/ op ; 136.8 MB/s |
compact : 123458261.013 micros/ op ; |
readrandom : 14.079 micros/ op ; |
readseq : 0.378 micros/ op ; 292.5 MB/s |
readreverse : 0.567 micros/ op ; 195.2 MB/s |
fill100K : 1516.707 micros/ op ; 62.9 MB/s (100000 ops) |
crc32c : 4.726 micros/ op ; 826.6 MB/s (4K per op ) |
snappycomp : 1.907 micros/ op ; (snappy failure) |
snappyuncomp : 0.954 micros/ op ; (snappy failure) |
$ sudo ./db_bench --num=1000000000 --write_buffer_size=$((256*1024*1024)) |
Date: Sun May 29 17:04:14 2011 |
CPU: 24 * Intel(R) Xeon(R) CPU X5670 @ 2.93GHz |
Values: 100 bytes each (50 bytes after compression) |
RawSize: 110626.2 MB (estimated) |
FileSize: 62942.5 MB (estimated) |
write_buffer_size=268435456 |
WARNING: Snappy compression is not enabled |
------------------------------------------------ |
fillseq : 2.126 micros/ op ; 52.0 MB/s |
fillsync : 63.644 micros/ op ; 1.7 MB/s (10000000 ops) |
fillrandom : 10.267 micros/ op ; 10.8 MB/s |
overwrite : 14.339 micros/ op ; 7.7 MB/s |
總結: Leveldb是個很好的kv庫,重點解決了隨機IO性能不好的問題,多線程更新的性能非常好.
玩得開心!
本文由用戶
openkk 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!