PiFlow是一個基於分散式計算框架Spark開發的大資料流水線系統。該系統將資料的採集、清洗、計算、儲存等各個環節封裝成元件,以所見即所得方式進行流水線配置。簡單易用,功能強大。本次版本更新如下特性:
Gitee地址: https://gitee.com/opensci/piflow
GitHub地址: https://github.com/cas-bigdatalab/piflow
[admin
]