为什么旧的 ReplicaSet 会启动 Pods

193次阅读

问题描述

在部署新版本应用程序至 AKS（Azure Kubernetes Service）集群后，注意到旧的 ReplicaSet 仍然在集群中启动 Pods。这种现象只在一个特定的 ReplicaSet 中出现。用户注意到这个问题是因为该 ReplicaSet 尝试对旧的数据库版本执行更新操作。用户想知道这种情况可能是什么原因造成的。

注意：问题经过进一步追踪，发现我们在系统测试集群上意外地运行了“旧”的 Pod，并且连接字符串设置错误。误导人的是 ReplicaSet 具有相同的名称，这是因为 ReplicaSet 的名称始终格式化为 [DEPLOYMENT-NAME]-[RANDOM-STRING]。随机字符串是随机生成的，并使用 Pod 模板哈希作为种子。

解决方案

问题分析

首先，让我们分析一下为什么旧的 ReplicaSet 会在部署新版本后继续启动 Pods。这通常与 Kubernetes 中的滚动更新机制有关。滚动更新允许在部署新版本时逐步替换旧的 Pods，以确保应用程序的可用性。

可能的原因

滚动更新策略不当：在部署时，如果滚动更新策略配置不正确，可能会导致旧的 ReplicaSet 中的 Pods 未能正确终止。这可能与 Pod 终止的时间间隔和等待时间相关。
数据库更新：在您的情况下，您提到 ReplicaSet 尝试对旧的数据库版本执行更新操作。这可能是因为您的应用程序代码中包含了数据库升级逻辑，导致旧的 Pods 仍然执行数据库更新操作。