在 AKS 集群中手动安装 Cluster Autoscaler 失败

37次阅读
没有评论

问题描述

想要在 AKS 集群中手动安装 Cluster Autoscaler,但是尝试了多种方法(使用 Helm Chart、使用 YAML 文件),都没有成功。用户参考了一些示例,但是在查看 Cluster Autoscaler Pod 的日志时,发现以下错误信息:

Failed to scale up: Could not compute total resources: No node info for: agentpool

用户想知道是否有解决方案来解决这个问题。

解决方案

请注意以下操作注意版本差异及修改前做好备份。

方案1

根据用户提供的信息,错误信息显示 Cluster Autoscaler 无法计算总资源,原因是找不到名为 “agentpool” 的节点信息。这可能是由于集群配置或命名空间问题导致的。
以下是一些可能的解决方案:
1. 确保 AKS 集群中存在名为 “agentpool” 的节点池。可以使用以下命令检查节点池的存在:
bash
az aks nodepool list --resource-group <resource_group_name> --cluster-name <cluster_name>

如果没有名为 “agentpool” 的节点池,请创建一个新的节点池,并确保在安装 Cluster Autoscaler 时使用正确的节点池名称。
2. 确保在安装 Cluster Autoscaler 时使用了正确的命名空间。可以使用以下命令检查命名空间的存在:
bash
kubectl get namespaces

如果没有正确的命名空间,请创建一个新的命名空间,并在安装 Cluster Autoscaler 时使用正确的命名空间。
3. 检查 Cluster Autoscaler 的配置文件是否正确。可以参考以下示例配置文件:
cluster-autoscaler-vmss.yaml
cluster-autoscaler-aks.yaml
cluster-autoscaler-autodiscover.yaml
确保配置文件中的节点池名称和命名空间与 AKS 集群中的实际情况匹配。

如果以上解决方案仍然无法解决问题,请提供更多详细信息,以便我们能够更好地帮助您解决问题。

正文完