挂载失败:在 Kubernetes 上使用 EBS 卷时退出状态 32

问题描述

我对 AWS 上的 k8s 设置集群有点困惑。我试图 使用 EBS 卷作为持久存储但找不到信息 足够了(我遗漏了一些东西,或者这是 aws provider https://kubernetes.github.io/cloud-provider-aws/ 的所有文档?

当我尝试将部署配置应用到我的集群时,输出来自 kubectl describe pods 是:

  Type     Reason                  Age              From                     Message
  ----     ------                  ----             ----                     -------
  normal   Scheduled               7s               default-scheduler        Successfully assigned default/mssql-deploy-67885c9f84-9xx7c to ip-172-31-0-215.sa-east-1.compute.internal
  normal   SuccessfulAttachVolume  4s               attachdetach-controller  AttachVolume.Attach succeeded for volume "mssql-volume"normal   SuccessfulAttachVolume  4s               attachdetach-controller  AttachVolume.Attach succeeded for volume "mssql-volume"
  Warning  FailedMount             3s (x4 over 6s)  kubelet                  MountVolume.SetUp Failed for volume "mssql-volume" : mount Failed: exit status 32
Mounting command: mount
Mounting arguments:  -o bind /var/lib/kubelet/plugins/kubernetes.io/aws-ebs/mounts/vol-02efbeface5569c51 /var/lib/kubelet/pods/01537252-4323-4e7c-9f05-a2a730498ecd/volumes/kubernetes.io~aws-ebs/mssql-volume
Output: mount: /var/lib/kubelet/pods/01537252-4323-4e7c-9f05-a2a730498ecd/volumes/kubernetes.io~aws-ebs/mssql-volume: special device /var/lib/kubelet/plugins/kubernetes.io/aws-ebs/mounts/vol-02efbeface5569c51 does not exist.

我设置了主节点,我认为这是使用 aws 的必要条件 provider,例如:将主机名设置为 priv dns,在 ClusterConfig 上设置 extraArgs cloud-provider aws, 在 EC2 实例中设置角色,如 cloud-provider-aws 文档(控制平面到主控, 节点到节点)。

然后我使用以下文件(通过 kubeadm join --config node.yaml)将节点加入集群:

apiVersion: kubeadm.k8s.io/v1beta1
kind: JoinConfiguration
discovery:
  bootstrapToken:
    token: "TOKEN-FROM-MASTER"
    apiServerEndpoint: "IP-PORT-FROM-MASTER"
    caCertHashes:
      - "SHA-FROM-MASTER"
nodeRegistration:
  name: $(hostname)
  kubeletExtraArgs:
    cloud-provider: aws

由于集群能够附加卷(这是真的,因为我在 AWS 控制台进行了验证),我认为问题出在节点上的 kubelet。

解决方法

尽管 aws 提供程序文档非常薄弱,但解决方案很简单。实际上我的搜索是错误的,错误的重要部分是最后,我们读到“特殊设备......不存在”。

有了这个,我在 stackoverflow https://stackoverflow.com/a/60325491/1169158 中找到了这个答案。

最后,我们需要做的就是在所有节点 + master 的 --cloud-provider=aws 中添加标志 /var/lib/kubelet/kubeadm-flags.env

希望这对您有用。