ベンチマーク (更新:2026-05-07)

Stable Diffusion XL ベンチマーク|GPU 別 1024×1024 生成速度 2026年版

Stable Diffusion XL(SDXL)の GPU 別生成時間とVRAM 使用量を集約。AUTOMATIC1111 / ComfyUI / Forge の各環境での秒数を主要 GPU で比較。

Stable Diffusion XL ベンチマーク|GPU 別 1024×1024 生成速度 2026年版 のサムネイル画像

※ 本記事はアフィリエイト広告(Amazon アソシエイト等)を含みます

Stable Diffusion XL(SDXL)の GPU 別生成性能を集約。1024×1024・25 ステップ・DPM++ 2M Karras の典型設定で、各 GPU の 生成秒数 / VRAM 使用量 を比較します。

SDXL 1024×1024 生成時間(中央値)

SDXL Base 1024×1024 25 ステップ
評価項目
GPU
生成秒数
VRAM 使用
Hires.fix 2x
RTX 4090 3.5 秒 10 GB 余裕
RTX 4080 SUPER 5.2 秒 10 GB 余裕
RTX 4070 Ti SUPER 6.0 秒 10 GB 余裕
RTX 4070 SUPER 7.2 秒 10 GB VRAM 12GB ギリ
RTX 4060 Ti 16GB 8.5 秒 10 GB **余裕**
RTX 4060 8GB 8.0 秒 8 GB **OOM エラー**
RX 7900 XTX 24GB 10 秒(ROCm) 10 GB 余裕
VRAM 16GB が SDXL Hires.fix の境界線。8GB GPU では Hires.fix できない。

ツール別の VRAM 効率

ツールVRAM 効率推奨
AUTOMATIC1111標準万能
ComfyUI◎(Meda Tiling 対応)VRAM 不足環境
Forge◎(A1111 派生・低 VRAM)VRAM 8GB 環境
Invoke AI商用利用

NVIDIA vs AMD

NVIDIA は CUDA で標準対応、AMD は ROCm(Linux 推奨)か DirectML(Windows・遅い)。生成 AI 用途は NVIDIA 一択

まとめ

SDXL は VRAM 16GB が境界線RTX 4060 Ti 16GB が「VRAM 重視のコスパ最強」。詳しくは 生成 AI 用自作 PCRTX 4060 Ti 16GB 完全解説 も参照。

出典・参考情報