IBM 開源資料和 AI 技術中心(CODAIT)推出了一個新工具包 covid-notebooks,該工具包可幫助開發人員和資料科學家回答有關大流行的問題。
covid-notebooks 旨在幫助完成以下任務:
IBM 方面表示,處理好這些任務,開發人員和資料科學家就可以解放出來,專注於高階分析和建模任務,而不用擔心資料格式和資料清理等問題。該儲存庫使用開發者友好的 Jupyter notebook 來涵蓋每個初始資料分析步驟。
此外還使用 Elyra Notebook Pipelines Visual Editor 和 KubeFlow Pipelines 建立了資料處理管道。示例如下:
這些管道使使用者只需單擊一個按鈕即可重新執行整個提取、轉換、分析工作流程。“我們資源庫中的工具使用權威來源,得出決策者可用於做出實時、關鍵決策的綜合見解。“
IBM 開源資料中心和AI中心首席架構師 Frederick Reiss 表示:“對於正在分析 COVID-19 的影響並試圖根據資料提出可行計劃的資料科學家和決策者來說,相關資訊可以說是鋪天蓋地。來自研究報告、新聞媒體、社交媒體和健康組織的資料幾乎源源不斷,這使得將資料分析為有用的行動的任務幾乎不可能完成。開發人員和資料科學家需要回答他們關於資料來源、工具以及如何從不斷變化的資料中得出有意義的、統計上有效的結論的問題。”
[admin
]