- OpenShift高效運維:SRE視角的集群和分布式系統管理
- (德)里克·拉考等
- 801字
- 2024-04-25 20:08:58
1.3 OpenShift作為站點可靠性工程師的工具
本書將幫助你利用OpenShift已經包含的工具,或者可以用最少的精力安裝的工具,以SRE方式操作軟件和OpenShift本身。
我們希望你對容器、Kubernetes和OpenShift的工作方式有一個基本的了解,以便能夠理解和遵循所有示例。我們不會詳細解釋像pod這樣的基本概念,但是對于有助于理解OpenShift的特定方面的相關內容,我們會進行快速復習。
我們將向你展示安裝OpenShift的不同選項,幫助你根據需要自動化OpenShift集群的生命周期。生命周期管理不僅包括安裝和拆除集群,還包括以GitOps方式管理OpenShift集群的配置。如果你需要管理多個集群的配置,那么可以使用OpenShift上的Argo CD。
本書通過一個簡單的示例應用程序向你展示如何在OpenShift上運行工作負載。你可以使用這個示例來瀏覽章節并嘗試代碼示例。但是,你應該能夠使用相同的模式來部署更重要的軟件,例如為管理OpenShift資源(如OpenShift Operator)而構建的自動化。
OpenShift還提供了自動化構建和部署軟件所需的工具,從簡單的自動化容器構建(無論何時簽入新更改)到版本控制,再到使用OpenShift Pipelines的完整的自定義管道。
除了自動化之外,管理OpenShift集群的SRE方法還包括允許擴展的適當警報。OpenShift提供了許多內置警報,當集群出現問題時,你可以使用這些警報獲得通知。本書將幫助你了解這些警報的嚴重級別,并向你展示如何根據OpenShift內置監控系統中可用的指標構建自己的警報。
作為OpenShift SRE在紅帽工作了兩年多,我們都學到了很多關于OpenShift發出的各種警報以及如何調查和解決問題的知識。與OpenShift工程緊密合作的好處是,如果我們在工作中發現問題,我們甚至可以在OpenShift中貢獻警報規則。
隨著時間的推移,許多人聯系了我們,對我們作為一個SRE團隊的工作方式很感興趣。我們意識到,人們對與我們的工作相關的所有不同主題都越來越感興趣:從我們如何運營OpenShift到構建自定義Operator,人們對會議的這個主題表現出興趣,或者直接與我們聯系。
這本書的目的是幫助你學習一些我們的經驗知識,并在你的特定環境中運行OpenShift。我們相信OpenShift是Kubernetes的一個很棒的發行版,它有很多額外的便捷功能,可以讓你快速入門并出色運維OpenShift。