有人建了一個 GitHub 倉庫,專門匯總使用 Kubernetes 失敗的案例。
項目創建者表示,Kubernetes 是一個相當複雜的系統,它帶有許多活動部件,生態在不斷發展,並且還在添加更多層,比如 Service Mesh。而在這樣的情況下,似乎業內缺乏真實而引人注意的 Kubernetes 失敗案例給大家相互借鑒。於是他創建了這麼一個倉庫,希望這些慘痛的經歷可以給包括 SRE、Ops、平台與基礎設施團隊在內的 Kubernetes 操作人員一些學習的機會,減少在生產中運行 Kubernetes 的風險。
目前項目已經更新了 30 余篇文章,涉及內容包括配置改變、數據被清空、GKE 集群升級事故、模板線行為誤解、集群中 DNS 掉線與應用遷移中斷等,具體內容查看:https://k8s.af
你使用 Kubernetes 有沒有過翻船經歷,歡迎留言分享。
[admin
]