在Kubernetes应用中如何最好地提供只读数据资产

182次阅读

问题描述

正在将一个HPC应用迁移到Kubernetes上，并试图确定提供只读数据资产作为配置管理快照的最佳方式。
以前，用户的团队将应用程序作为一组RPM包交付，但随着他们转向Kubernetes，他们开始交付Docker镜像。对于应用程序二进制文件来说，这种方式很好，因为我们只需要交付一个已知工作的镜像，而不是一堆需要保持一致的RPM包。
然而，问题出现在只读数据资产上（类似于游戏的资源文件）。多个不同的Docker镜像可能依赖于同一组数据资产，因此我们不希望将它们直接嵌入到Docker镜像本身中（而且我们希望能够在不重新编译应用程序镜像的情况下更改资产）。
用户不确定最佳方法是什么。第一个想法是创建一个“数据容器”，它只运行NFS并提供数据。这样可以成功地将数据与应用程序隔离开，并允许我们将一组数据RPM包合并为一个带有标签的Docker镜像，但我觉得这可能有点过度设计。
用户知道他们实际上是在寻找Kubernetes的持久卷，但对他们来说，将所有数据捆绑到一个与Docker镜像具有相同交付便利性的单个包中是一个问题。
有没有更好的方法将这些只读数据提供为版本控制的快照？

解决方案

请注意以下操作注意版本差异及修改前做好备份。

方案1

用户可以使用Kubernetes的持久卷（Persistent Volume）来解决这个问题。可以创建一个只读的持久卷，然后将数据加载到该持久卷中。然后，将持久卷挂载到应用程序的Pod中，以便应用程序可以读取数据。
以下是实现这个方案的步骤：
1. 创建一个只读的持久卷（Persistent Volume）。
2. 将数据加载到持久卷中。
3. 在应用程序的Pod中挂载持久卷。
下面是一个示例的持久卷配置文件：

apiVersion: v1
kind: PersistentVolume
metadata:
  name: data-pv
spec:
  capacity:
    storage: 15Gi
  accessModes:
    - ReadOnlyMany
  persistentVolumeReclaimPolicy: Retain
  storageClassName: standard
  nfs:
    path: /path/to/data
    server: nfs-server-ip

在上面的示例中，我们创建了一个只读的持久卷，并指定了容量、访问模式和NFS服务器的地址和路径。用户需要根据实际情况进行相应的配置。
然后，可以在应用程序的Pod配置文件中挂载持久卷：

apiVersion: v1
kind: Pod
metadata:
  name: app-pod
spec:
  containers:
    - name: app-container
      image: your_image
      volumeMounts:
        - name: data-volume
          mountPath: /path/to/data
  volumes:
    - name: data-volume
      persistentVolumeClaim:
        claimName: data-pvc

在上面的示例中，我们在应用程序的Pod配置文件中定义了一个持久卷声明（Persistent Volume Claim），并将其挂载到应用程序容器的指定路径上。

方案2

另一种方法是使用内容分发网络（CDN）来提供只读数据资产。CDN可以将数据缓存到全球各地的服务器上，以提供更快的访问速度和更好的可扩展性。
用户可以将数据上传到CDN，并使用CDN提供的URL来访问数据。应用程序可以通过HTTP请求来获取数据。

方案3

用户还可以使用云提供商的存储桶（Bucket）来存储只读数据资产。存储桶是一种用于存储和访问数据的对象存储服务。用户可以将数据上传到存储桶，并使用存储桶提供的URL来访问数据。
以下是一些常见的云提供商的存储桶服务：
– AWS S3
– Google Cloud Storage
– Azure Blob Storage
用户可以根据自己的需求选择适合自己的存储桶服务。
请注意，CDN和存储桶服务可能需要额外的配置和费用。用户需要根据自己的需求和预算来选择合适的解决方案。

正文完