Apache Tajo 0.10.1 發布,分布式數據倉庫
Apache Tajo 0.10.1 發布,Tajo 是一個分布式數據倉庫系統,基于 Hadoop 實現,特點是低延遲、高可伸縮,提供專用查詢和 ETL 工具
特點:
-
可伸縮性和低延遲
</li>-
完全分布式的 SQL 查詢處理,基于存儲雨 HDFS 的大數據集
</li> -
超低響應時間(約100毫秒),在合理數據范圍內的簡單查詢
</li> </ul> -
支持長時間運行的查詢
</li>-
容錯支持,避免某些任務失敗后的查詢重啟
</li> -
動態調度,處理和異構集群節點故障
</li> </ul> -
ETL
</li>-
ETL 可實現不同數據格式之間的轉換
</li> -
支持多種文件格式,如 CSV、RCFile 和 RowFile
</li> </ul> -
擴展性
</li>-
支持用戶自定義函數
</li> -
提供自定義文件格式的 Scanner/Appender 接口
</li> </ul> -
兼容性
</li>-
遵循 ANSI/ISO SQL 標準,非標準方面遵循 PostgreSQL 規范
</li> -
支持 HiveQL 模式
</li> -
在 HCatalog 和 Hive MetaStore 實現表訪問
</li> -
支持 JDBC 驅動
</li> </ul> -
簡單
</li>-
提供交互式 Shell 來提交 SQL 查詢到 Tajo 集群
</li> -
提供備份和恢復工具
</li> -
異步/同步 Java API 來提交 SQL 查詢到 Tajo 集群
</li> </ul> </ul>這是一個小的更新版本,值得關注的改進有:
* Support multi-bytes delimiter for CSV/Text file (TAJO-1374, TAJO-1381) * JDBC program is stuck after closing (TAJO-1619) * INSERT INTO with wrong target columns causes NPE. (TAJO-1623) * Add TajoStatement::setMaxRows method support (TAJO-1400) * Fix NPE on natural join (TAJO-1574) * Implement json_extract_path_text(string, string) function (TAJO-1529) * CURRENT_DATE generates parsing errors sometimes. (TAJO-1386) * Simple query doesn’t work in Web UI. (TAJO-1147)
詳細記錄請看這里。
來自:http://www.oschina.net/news/63821/apache-tajo-0-10-1本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
-
-
-
-
-
-