CouchDB 讓人頭痛的十大問題
下面十條內容來自paperplanes的博主Mathias Meyer,他也是一位NoSQL的實踐者,CouchDB就是其鐘愛的數據庫之一。正所謂愛之深恨之切,在使用CouchDB的過程中,他發現很多不順手的地方,就是本文列舉的十大問題。
View是在讀時更新的
我們知道CouchDB不支持動態查詢,也就是說你的每個查詢,都需要事先創建一個對應的View,創建View是很快的,即使你的數據集很大,這 是因為CouchDB并不在創建View的時候就建立View索引,而是在讀取的時候來做這個事。當在一個View上執行一次讀操作時,CouchDB會 對比當前View中的索引更新時間與最后寫操作時間,如果發現在索引更新之后又有寫操作,那么會把這段時間的寫操作合并到索引中再返回給客戶端。
你可以想象到,如果數據集非常大,你創建完View后的第一次讀取會是多慢。同樣的,如果你兩次讀操作間隔期間有太多的寫操作,那么也會導致讀操作 非常慢,有的朋友通過cron任務定時對View進行查詢,從而觸發定時的索引更新操作,以減少真正讀操作需要等待的時間,不得不說這真是蛋疼。這一切, 都是因為CouchDB的View是在讀時更新導致的。
而實際上,如果你不愿意等待CouchDB去更新完索引后再返回數據,你也可以通過stale=ok參數指定它返回老數據即可,不用做更新操作。但 我們不能總是訪問老數據,作者希望可以通過指定查詢先返回老的數據,再進行相應的索引更新操作。而實際上這一功能已經在1.1.0版本中實現了,在 1.1.0版本中,添加了一個stale=update_after的指定,可以實現返回老數據后再在后臺更新的功能。
缺乏自動壓縮功能
CouchDB采用了append-only的方法進行數據更新,也就是所有數據的寫操作,都不會修改原來的數據文件,而是追加上新的版本來實現。 這使得CouchDB能夠實現對同一條數據保存多個版本。也使得CouchDB的數據文件永遠不會被改花掉。因為它永遠在做append操作,即使出現問 題,只要去掉尾巴上一某一段數據就能回到之前某個時間的數據快照。
然而,這些好的特性必然需要付出代價,這代價就是數據大小會只增不減的膨脹。所以,數據壓縮工作是遲早都得做的事。但是CouchDB并沒有提供數據自動壓縮的功能。這讓人很郁悶。
不支持局部更新
局部更新的意思就是,不更新整條數據,只更新其它某個屬性或字段。這個看似天經地義的功能,在CouchDB里卻沒有。在CouchDB中,所有的update操作都需要對整條數據進行更新。
缺乏內存的擴展性支持
CouchDB的同步機制是很牛X的,這幾乎是它的殺手級功能。你可以隨意在集群中添加刪除節點, 可以隨意指定Master和Slave的角色, 數據都會很好的同步到所有節點上。能達到這樣的效果,是由CouchDB本身的機制決定的。然而,我們并不能做跨節點的讀寫操作。
在這方面,CouchDB-lounge算是一個嘗試,但是它把整個架構復雜化了,我感覺不太舒服。
分頁實現起來會很奇怪
如果你要對CouchDB中的數據進行分頁展示,這會比較麻煩,在《CouchDB權威指南》中有一個對分頁的實現,但是這個實現給人感覺非常別扭。如果你要在CouchDB中實現分頁的話,最好還是用那個“獲取更多”按鈕的方式來做。
范圍查詢使用不太方便
如果你的key是這樣的['123', '2010/07/21'],其中前一部分為查詢的key,后一部分為時間,用于保證記錄的順序性。這時候你要查詢所有’123′開頭的記錄時,就需要指 定起始條件為 ['123'],并且還必須指定一個終止條件為['123',{}],這樣讓人感覺用起得很不方便。
CommonJS無法用于mapreduce函數中
在CouchDB 0.11版本中,CommonJS已經可以用在view函數上,但是一直不能用在mapreduce函數中。這讓我總是重復一些寫過的代碼。
缺乏document之間完備的包含關系
在CouchDB 0.11中,map函數可以通過{_id: doc.other_id}的方式包含另外一個document的引用,在查詢時能夠獲取到對應這個文檔的id,但是再進一步,如果我想再獲取被包含的這 個文檔的屬性,那就沒辦法了。希望能夠有辦法通過當前集合的查詢,獲取并返回這個包含的文檔的某些屬性。
讀操作總是會落到磁盤上
CouchDB沒有實現自己的緩存。在寫操作中,你可以通過delay commit的方式將寫操作延遲同步,這樣就避免了每次寫操作就需要寫磁盤。但除此之外,CouchDB沒有做任何緩存。對于移動設備上的CouchDB 來說,寫磁盤可能會好一些,畢竟移動設備上的flash設備比服務器上的傳統磁盤性能要好一些。
沒用的錯誤信息
CouchDB的錯誤信息經常讓人摸不著頭腦,根本就看不明白錯誤出在哪里。比如下面這一段,你能告訴我它說明了什么問題嗎。
{<0.84.0>,supervisor_report, [{supervisor,{local,couch_secondary_services}}, {errorContext,start_error}, {reason, {'EXIT', {undef, [{couch_auth_cache,start_link,[]}, {supervisor,do_start_child,2}, {supervisor,start_children,3}, {supervisor,init_children,2}, {gen_server,init_it,6}, {proc_lib,init_p_do_apply,3}]}}}, {offender, [{pid,undefined}, {name,auth_cache}, {mfa,{couch_auth_cache,start_link,[]}}, {restart_type,permanent}, {shutdown,brutal_kill}, {child_type,worker}]}]}}
好了,大概就這些吧。雖然上面說了這么多CouchDB讓人不爽的地方,但是總的來說,我還是很喜歡CouchDB的,雖然有上面一些讓人不爽的地 方,但是它還是能幫我處理很多問題。所以爭論一個東西是否要用,并不是看它能不能滿足所有需求,而是看它能不能滿足你要的核心需求就行了。
來源:www.paperplanes.de
譯文:http://blog.nosqlfan.com/html/3667.html