Java數據轉換引擎 - Data Pipeline
Data Pipeline 是一個Java的數據轉換工具包,主要的功能包括:
* 讀: CSV, fixed-width, Excel, database, weblogs, custom
* 寫: CSV, fixed-width, Excel, database, PDF, Word, XML, custom
* 操作: validate, filter, sort, lookup, 去除重復數據, convert, throttle, calculate, custom, and more
* 運行時表達式過濾器、數據驗證以及公式計算
典型的應用場景包括:
1. 讀取 CSV 文件
2. 刪除重復的記錄
3. 添加計算列
4. 刪除無用的列
5. 數據保存到數據庫
代碼示例:
DataReader reader = new CSVReader(new File("credit-balance.csv")) .setFieldNamesInFirstRow(true); // Use only the "Rating" and "CreditLimit" fields in duplicate test reader = new RemoveDuplicatesReader(reader, new FieldList("Rating", "CreditLimit")); // Add AvailableCredit field, remove "CreditLimit", "Balance" fields reader = new TransformingReader(reader) .add(new SetCalculatedField("AvailableCredit", "parseDouble(CreditLimit) - parseDouble(Balance)")) .add(new ExcludeFields("CreditLimit", "Balance")); DataWriter writer = new JdbcWriter(getJdbcConnection(), "dp_credit_balance") .setAutoCloseConnection(true); JobTemplate.DEFAULT.transfer(reader, writer);
本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!