分布式數據處理引擎Apache Flink?v1.1.1發布

jopen 9年前發布 | 15K 次閱讀分布式 Java Apache Flink

Flink 是一個針對流數據和批數據的分布式處理引擎。它主要是由 Java 代碼實現。目前主要還是依靠開源社區的貢獻而發展。對 Flink 而言，其所要處理的主要場景就是流數據，批數據只是流數據的一個極限特例而已。再換句話說，Flink 會把所有任務當成流來處理，這也是其最大的特點。Flink 可以支持本地的快速迭代，以及一些環形的迭代任務。并且 Flink 可以定制化內存管理。在這點，如果要對比 Flink 和 Spark 的話，Flink 并沒有將內存完全交給應用層。這也是為什么 Spark 相對于 Flink，更容易出現 OOM 的原因（out of memory）。就框架本身與應用場景來說，Flink 更相似與 Storm。如果之前了解過 Storm 或者 Flume 的讀者，可能會更容易理解 Flink 的架構和很多概念。

Flink 的架構圖

下載

本站原創，轉載時保留以下信息：
本文轉自：深度開源（open-open.com）
原文地址：http://www.baiduhome.net/news/view/2e2e385d

本文由用戶 jopen 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/news/view/2e2e385d

分布式 Java Apache Flink

分布式數據處理引擎Apache Flink?v1.1.1發布

下載

相關資訊

相關經驗

相關文檔