開源計算框架:Apache Tez

jopen 9年前發布 | 10K 次閱讀 分布式/云計算/大數據 Apache Tez

Tez 是 Apache 最新的支持 DAG 作業的開源計算框架,它可以將多個有依賴的作業轉換為一個作業從而大幅提升DAG作業的性能。Tez并不直接面向最終用戶——事實上它允許開發者為最終用 戶構建性能更快、擴展性更好的應用程序。Hadoop傳統上是一個大量數據批處理平臺。但是,有很多用例需要近乎實時的查詢處理性能。還有一些工作則不太 適合MapReduce,例如機器學習。Tez的目的就是幫助Hadoop處理這些用例場景。

Tez的兩大設計主題:

  • Empowering end users by:
    • Expressive dataflow definition APIs
    • Flexible Input-Processor-Output runtime model
    • Data type agnostic
    • Simplifying deployment
  • Execution Performance
    • Performance gains over Map Reduce
    • Optimal resource management
    • Plan reconfiguration at runtime
    • Dynamic physical data flow decisions

開源計算框架:Apache Tez

開源計算框架:Apache Tez

項目主頁:http://www.baiduhome.net/lib/view/home/1445476116710

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!