Java數據轉換引擎 - Data Pipeline

fmms 12年前發布 | 39K 次閱讀 Java 常用工具包

Data Pipeline 是一個Java的數據轉換工具包,主要的功能包括:

* 讀: CSV, fixed-width, Excel, database, weblogs, custom
* 寫: CSV, fixed-width, Excel, database, PDF, Word, XML, custom
* 操作: validate, filter, sort, lookup, 去除重復數據, convert, throttle, calculate, custom, and more
* 運行時表達式過濾器、數據驗證以及公式計算

Java數據轉換引擎 - Data Pipeline

典型的應用場景包括:
1. 讀取 CSV 文件
2. 刪除重復的記錄
3. 添加計算列
4. 刪除無用的列
5. 數據保存到數據庫

代碼示例:

DataReader reader = new CSVReader(new File("credit-balance.csv"))
.setFieldNamesInFirstRow(true);

// Use only the "Rating" and "CreditLimit" fields in duplicate test
reader = new RemoveDuplicatesReader(reader, new FieldList("Rating", "CreditLimit"));

// Add AvailableCredit field, remove "CreditLimit", "Balance" fields
reader = new TransformingReader(reader)
.add(new SetCalculatedField("AvailableCredit", "parseDouble(CreditLimit) - parseDouble(Balance)"))
.add(new ExcludeFields("CreditLimit", "Balance"));

DataWriter writer = new JdbcWriter(getJdbcConnection(), "dp_credit_balance")
.setAutoCloseConnection(true);

JobTemplate.DEFAULT.transfer(reader, writer);

項目主頁:http://www.baiduhome.net/lib/view/home/1326935502655

 本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!