Cassandra 1.0.0 為進軍企業做好了準備
近日,Apache發布了Cassandra 1.0.0,這是該分布式基于列的數據存儲的首個主要里程碑版本,帶來了數據壓縮與其他幾處性能改進和優化。
Cassandra為Apache的頂級開源項目,是個可伸縮的分布式(Amazon的Dynamo與Google BigTable基于列的數據模型是其代表)數據庫管理系統。Cassandra最初是由非死book開發的,后來在2008年開源,現在一直處于開發當中。近日,Apache發布了其首個主要的里程碑版本Cassandra 1.0.0,帶來了大量的新特性、改進和Bug修復。
呼聲最高的一個特性就是數據壓縮。Cassandra 1.0支持每個ColumnFamily的數據壓縮,ColumnFamily是個列的容器,類似于傳統關系數據庫的表。壓縮過程在后臺運行,對于節點的響應時間沒什么影響。壓縮將數據所占據的空間減少了2到4倍,據Pavel Yaskevich所述,這間接提升了25-35%的讀性能以及5-10%的寫性能。
根據Apache Cassandra項目的副總裁Jonathan Ellis所述,從Cassandra 0.6到1.0,性能有了很大的提升,“與2010年的發布相比,寫性能提升了40%。但我們真正想要改進的是讀性能,這提升了驚人的400%”。
其他改進有:
通過off-heap緩存、空間搜集和自動化的自我調整,內存管理得到了改進,GC暫停數更少、性能更加可預測(點擊 這里查看詳細信息)。
更好的磁盤空間管理:通過提交日志與即時刪除廢棄的數據文件實現了更好的空間占用控制。
新的可選級別的壓縮策略,提供了更加可預測的性能與確定的SStable大小(點擊 這里查看詳細信息)。
改進的hinted handoffs,這樣就需要更少的讀修復,實現了更好的讀性能。
大量的性能改進(點擊 這里查看詳細信息)、CQL、修復、更簡單的操作等等。
目前,Cisco、Digg、非死book、Rackspace、Reddit、推ter 等公司都在使用Cassandra,最大的產品集群在150多臺機器上擁有超過100TB的數據。
查看英文原文:Cassandra 1.0.0. Is Ready for the Enterprise
文章出處:InfoQ
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!