⏱️Slurm
本ページでは、NVIDIA DGX SuperPOD 環境で GPU 計算を行うために必要な
Slurm の基本的な使い方を解説します。
⚠️ 重要
GPU ノードは 必ず Slurm 経由で利用してください。
直接 SSH しての利用は禁止されています。
Slurm とは?
Slurm は、GPU・CPU などの計算資源を複数ユーザーで安全に共有するための
ジョブスケジューラです。
Slurm を使うことで:
- 他ユーザーと競合しない
- 利用状況が可視化される
- 公平な資源割り当てが行われる
といったメリットがあります。
基本用語
| 用語 | 意味 |
|---|---|
| ジョブ | 実行する計算タスク |
| ノード | 計算機(GPUノードなど) |
| パーティション | ノードのグループ(gpu など) |
| キュー | ジョブ待ち状態 |
| 割り当て | 資源を確保した状態 |
GPU ノードを対話的に使う(srun)
最も基本的な使い方
srun --partition=gpu --gres=gpu:1 --pty bash