MIG (Multi-Instance GPU) — это технология NVIDIA, позволяющая разделить один физический GPU на несколько изолированных логических GPU (инстансов). В контексте Kubernetes это позволяет запускать несколько контейнеров с выделенными частями одного GPU, обеспечивая изоляцию ресурсов и повышая эффективность использования GPU.

В Kubernetes для работы с MIG обычно используется NVIDIA Device Plugin, который обнаруживает и экспортирует каждый MIG-инстанс как отдельное устройство. Это позволяет подам запрашивать конкретные MIG-инстансы через ресурсы в манифестах.

Поддерживаются GPU архитектуры NVIDIA Ampere и новее, например, A100, A30, A40 и другие, которые имеют аппаратную поддержку MIG. Старые поколения GPU, такие как Turing или Volta, не поддерживают MIG.

Пример использования в Pod spec:

resources:
  limits:
    nvidia.com/mig-1g.5gb: 1

Здесь mig-1g.5gb — тип MIG-инстанса, указывающий на выделение части GPU с определёнными ресурсами.

Как работает MIG в контексте Kubernetes и какие GPU его поддерживают?