如何停止和启动Kubernetes集群

402次阅读

问题描述

在使用kubeadm启动的Kubernetes集群中，有一个需求是希望能够安全地停止和启动整个集群，而不会影响部署的应用。
用户尝试直接重启主节点的虚拟机，但发现大部分系统Pod的容器都处于停止状态。

解决方案

请注意以下操作注意版本差异及修改前做好备份。

方案1

如果你的集群中有持久化卷（Persistent Volumes）的话，你可以在停止主节点时保留数据。这在使用GKE（Google Kubernetes Engine）时尤其适用。但是，如果你希望在完全停止主节点的情况下保持服务运行，那就需要使用高可用性（High Availability）的方式，让一个主节点接管另一个主节点的责任，实现集群化（clustering）。

方案2

请注意以下操作可能会导致服务中断，请谨慎操作。
另一种方法是直接停止和启动整个集群。但是，这样做可能会导致服务中断，因此需要谨慎操作。以下是停止和启动整个Kubernetes集群的步骤：
1. 停止集群：
– 首先，使用以下命令停止所有的Pod：
shell kubectl scale --replicas=0 deployment --all
– 然后，停止所有的节点：
shell kubectl drain --ignore-daemonsets --delete-local-data --force --grace-period=30 <node-name>
其中，<node-name>是节点的名称，可以使用kubectl get nodes命令查看。
– 最后，停止主节点的虚拟机。
2. 启动集群：
– 首先，启动主节点的虚拟机。
– 然后，使用以下命令启动所有的节点：
shell kubectl uncordon <node-name>
其中，<node-name>是节点的名称。
– 最后，使用以下命令启动所有的Pod：
shell kubectl scale --replicas=1 deployment --all
请注意，停止和启动整个集群可能会导致服务中断，因此在执行这些操作之前，请确保你的应用可以容忍短暂的中断。