Skip to main content

⏱️Slurm

本ページでは、NVIDIA DGX SuperPOD 環境で GPU 計算を行うために必要な
Slurm の基本的な使い方を解説します。

⚠️ 重要
GPU ノードは 必ず Slurm 経由で利用してください。
直接 SSH しての利用は禁止されています。


Slurm とは?

Slurm は、GPU・CPU などの計算資源を複数ユーザーで安全に共有するための
ジョブスケジューラです。

Slurm を使うことで:

  • 他ユーザーと競合しない
  • 利用状況が可視化される
  • 公平な資源割り当てが行われる

といったメリットがあります。


基本用語

用語意味
ジョブ実行する計算タスク
ノード計算機(GPUノードなど)
パーティションノードのグループ(gpu など)
キュージョブ待ち状態
割り当て資源を確保した状態

GPU ノードを対話的に使う(srun)

最も基本的な使い方

srun --partition=gpu --gres=gpu:1 --pty bash