Hadoop 通用數據攝取框架:Gobblin
Gobblin 是 Hadoop 通用數據攝取框架,可以從各種數據源中提取,轉換和加載海量數據。比如:數據庫,rest APIs,filers,等等。Gobblin 處理日常規劃任務需要所有數據攝取 ETLs,包括作業/任務規劃,任務分配,錯誤處理,狀態管理,數據質量檢測,數據發布等等。
Gobblin 通過同樣的執行框架從不同數據源攝取數據,在同一個地方管理所有不同數據源的元數據。同時結合了其他特性,比如自動伸縮,容錯,數據質量保證,可擴展和處理數據模型改革等等。Gobblin 變得更容易使用,是個高效的數據攝取框架。
本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!