Hadoop 通用數據攝取框架:Gobblin

jopen 9年前發布 | 31K 次閱讀 Gobblin 分布式/云計算/大數據

Gobblin 是 Hadoop 通用數據攝取框架,可以從各種數據源中提取,轉換和加載海量數據。比如:數據庫,rest APIs,filers,等等。Gobblin 處理日常規劃任務需要所有數據攝取 ETLs,包括作業/任務規劃,任務分配,錯誤處理,狀態管理,數據質量檢測,數據發布等等。

Gobblin 通過同樣的執行框架從不同數據源攝取數據,在同一個地方管理所有不同數據源的元數據。同時結合了其他特性,比如自動伸縮,容錯,數據質量保證,可擴展和處理數據模型改革等等。Gobblin 變得更容易使用,是個高效的數據攝取框架。


項目主頁:http://www.baiduhome.net/lib/view/home/1442242109290

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!