전체 목차 — GPU별·OS별 완전 가이드
ComfyUI란? — 개념·특징·다른 UI와의 차이
ComfyUI는 comfyanonymous가 2023년 1월 오픈소스로 공개한 노드 기반(Node-based) AI 이미지·영상 생성 인터페이스입니다. 이미지 생성의 모든 단계를 개별 노드로 분리하여 모델 로드, 텍스트 인코딩, 샘플러, VAE 디코딩, 저장 단계를 사용자가 시각적으로 직접 연결하게 해줍니다. 각 단계를 투명하게 제어하며 중간에 업스케일, 인페인팅, LoRA, ControlNet 등을 마음대로 삽입할 수 있습니다. 워크플로우는 JSON 파일이나 이미지 파일(PNG 메타데이터에 포함) 형태로 손쉽게 저장 및 공유할 수 있는 것이 큰 장점입니다.
🔢 노드 기반 구조란?
일반 UI가 “프롬프트 → 이미지” 단일 블랙박스라면, ComfyUI는 이 과정을 완전히 분해하여 제어권을 사용자에게 넘깁니다.
[Load Checkpoint]──모델──▶[CLIP Text Encode]◀──긍정 프롬프트
│ └──CLIP──▶[CLIP Text Encode]◀──부정 프롬프트
│ │
▼ ▼
[Empty Latent Image]──▶[KSampler]◀──모델/조건
(해상도·배치) │
▼
[VAE Decode]
│
▼
[Save Image]──▶ 완성 이미지⚖️ ComfyUI vs AUTOMATIC1111 vs Forge — 선택 기준
| 항목 | ComfyUI | AUTOMATIC1111 | Forge |
|---|---|---|---|
| 인터페이스 | 🟢 노드 그래프 (무제한 확장) | 🟡 탭·슬라이더 UI | 🟡 A1111 기반 UI |
| 학습 곡선 | 🔴 높음 (처음엔 복잡) | 🟢 낮음 (직관적) | 🟢 낮음 |
| 최신 모델 지원 | 🟢 즉시 (day-1, 노드 추가만) | 🟡 늦은 편 (전체 수정 필요) | 🟢 빠름 |
| 워크플로우 복잡도 | 🟢 무제한 (분기·루프·병렬) | 🔴 제한적 | 🔴 제한적 |
| VRAM 효율 | 🟢 최고 (스마트 오프로딩) | 🟡 보통 | 🟢 좋음 |
| 속도 | 🟢 A1111 대비 54% 빠름 | 기준 | 🟢 빠름 (유사) |
| 공유/재현 | 🟢 JSON·PNG 드래그앤드롭 완전 재현 | 🔴 불가 (설정 내보내기 제한) | 🔴 불가 |
| API 서버 모드 | 🟢 내장 | 🟡 API 있지만 제한 | 🟡 있음 |
| FLUX·SD3.5·영상 | 🟢 완벽 지원 | 🔴 제한 | 🟡 일부 |
| 권장 대상 | 파워유저·개발자·프로 | 입문자·캐주얼 | 중급자 |
✅ 2026년 ComfyUI 주요 지원 모델
ComfyUI는 스마트 VRAM 오프로딩 기술을 구현하여 VRAM이 부족하면 자동으로 시스템 RAM으로 모델 일부를 옮겨 실행합니다. 속도는 느리지만 VRAM 1GB 그래픽카드에서도 SD 1.5 생성이 이루어지며, GGUF 양자화 모델을 활용하면 적은 VRAM으로도 훌륭한 고품질 결과물을 얻어낼 수 있습니다.
하드웨어 요구사항 & GPU별 성능 가이드
🎮 GPU별 지원 현황 (2026년 5월 기준)
| GPU 제조사 | 지원 방식 | 지원 수준 | Windows | Linux |
|---|---|---|---|---|
| NVIDIA (GeForce, RTX, GTX) | CUDA 13.0 (cu130) / 12.8 | 🟢 완전 지원 · 최고 성능 | 🟢 권장 | 🟢 권장 |
| AMD RDNA 3/3.5/4 (RX 7000+, RX 9000) | ROCm 7.x / 포터블 빌드 | 🟢 공식 지원 (지속 개선) | 🟡 ROCm on WSL2 / 포터블 | 🟢 최고 효율 |
| AMD RDNA 2 이하 (RX 6000) | DirectML / ROCm | 🟡 제한적 지원 | 🟡 DirectML | 🟡 수동 가속 |
| Intel Arc A 및 B 시리즈 | PyTorch XPU / IPEX | 🟡 지원 (빠르게 개선 중) | 🟢 XPU 포터블 지원 | 🟡 수동 빌드 |
| Intel Core Ultra (내장 그래픽) | XPU / DirectML | 🟡 제한적 작동 | 🟡 테스트 가능 | 🟡 제한적 |
| Apple Silicon (M1~M4) | MPS 백엔드 | 🟡 지원 (3~5배 느림) | – | – |
| CPU 전용 | –cpu 파라미터 | 🟡 매우 느림 (장당 수분~수십분) | 🟢 작동 가능 | 🟢 작동 가능 |
💾 VRAM 용량별 실행 가능한 모델 및 권장 작업
| VRAM 용량 | 대표 GPU 모델 | 가능한 작업 및 모델 범위 | 권장 해상도 | 체감 속도 |
|---|---|---|---|---|
| 24GB+ | RTX 3090/4090, RX 7900 XTX | 모든 이미지 모델 최고 정밀도(bf16) 실행, Wan/Hunyuan 영상 생성 가능 | 2048×2048 / 제한없음 | 🟢 최고속 |
| 16GB | RTX 4080, RX 7900 XT | FLUX.1 Dev bf16/fp8, SDXL 여러 LoRA 동시 스태킹, 기본 영상 생성 | 1536×1536 ~ 2K | 🟢 쾌적 |
| 12GB | RTX 4070, RTX 3060 12G, B580 | FLUX.1 Dev fp8 (쾌적), SD 3.5 Large fp8, SDXL 고해상도, HiDream | 1024×1024 | 🟢 쾌적 |
| 8GB | RTX 4060 Ti, RTX 3070, RX 7600 | SDXL 기본, SD 3.5 Medium fp8, FLUX Schnell (GGUF Q4 양자화) | 1024×1024 | 🟡 보통 |
| 6GB | RTX 4060, RTX 3060 6G | SD 1.5 쾌적, SDXL (–lowvram), FLUX GGUF Q2/Q4 활용 | 768×768 ~ 1024 | 🟡 느림 |
| 4GB | GTX 1650, RTX 3050 | SD 1.5 (일반), SD 2.1, SDXL-Turbo (–lowvram 사용 필수) | 512×512 ~ 768 | 🔴 매우 느림 |
| 1GB+ | 구형 혹은 내장 그래픽 카드 | CPU 오프로딩 모드 작동 가능. 테스트 및 교육 목적 | 512×512 | 🔴 초저속 |
🎮 GPU 벤치마크 비교 — SDXL 1024×1024 (20스텝, 초/이미지)
| GPU | VRAM | 아키텍처 | SDXL 속도 | FLUX.1 속도 | 비고 |
|---|---|---|---|---|---|
| RTX 5090 | 32GB | Blackwell | ~2초 | ~5초 | SageAttention v3 공식 가속 |
| RTX 4090 | 24GB | Ada Lovelace | ~3초 | ~8초 | 최고의 가성비 딥러닝/프로급 |
| RTX 4080 Super | 16GB | Ada Lovelace | ~5초 | ~13초 | FLUX 및 고해상도 쾌적 운용 |
| RTX 4070 Ti | 12GB | Ada Lovelace | ~7초 | ~18초 | SDXL 최적의 성능 밸런스 |
| RTX 4070 | 12GB | Ada Lovelace | ~9초 | ~22초 | 가장 대중적인 크리에이터 선택 |
| RTX 3080 | 10/12GB | Ampere | ~11초 | ~28초 | xFormers 가속 효율 우수 |
| RTX 3060 | 12GB | Ampere | ~18초 | ~45초 | VRAM은 넉넉하나 코어 연산 느림 |
| RX 7900 XTX | 24GB | RDNA3 | ~11초 | ~22초 | Linux ROCm 최적화 시 엔비디아 80%급 |
| RX 7900 XT | 20GB | RDNA3 | ~14초 | ~30초 | ROCm 리눅스 공식 완벽 지원 |
| RX 7600 | 8GB | RDNA3 | ~35초 | 미지원* | GGUF 우회 및 강제 활성화 필요 |
| Intel Arc B580 | 12GB | Xe2 | ~40초 | 제한적 지원 | IPEX 전용 설치 스크립트 이용 |
💿 시스템 하드웨어 구성 필수 권장 사항
- ✓시스템 RAM: 최소 16GB, 권장 32GB 이상. 대형 영상 생성/FLUX 구동 시 64GB 권장. 보통 GPU VRAM 용량의 2배 이상이 안정적입니다.
- ✓저장 디스크 (SSD 필수): NVMe SSD 설치를 강력하게 권장합니다. FLUX Dev(12~24GB), SDXL(7GB) 등 대형 모델 로드 시 NVMe는 약 20초가 소요되는 반면, 일반 HDD는 수 분 이상 소요되거나 시스템이 멈출 수 있습니다. 기본 100GB에서 여유 있게 500GB+ 공간 계획을 권장합니다.
- ✓CPU 사양: 최신 Intel i5/i7 또는 AMD Ryzen 5/7 이상. 연산 핵심은 GPU가 전담하므로 CPU 부담은 상대적으로 적습니다.
- ✓지원 운영체제: Windows 10/11 64비트 환경 혹은 Ubuntu 20.04 / 22.04 LTS 버전을 권장합니다.
NVIDIA GPU — Windows 설치 완전 가이드
📦 방법 1: 포터블 패키지 설치 (가장 쉽고 강력하게 추천)
Python 환경이나 별도 드라이버 빌드가 필요 없는 독립 실행형 패키지입니다. 다운로드 후 압축 해제만으로 실행 환경이 조성됩니다.
github.com/comfyanonymous/ComfyUI/releases 최신 항목으로 진입한 뒤, 최신 CUDA 가속 버전인 ComfyUI_windows_portable_nvidia.7z (또는 cu128 포터블 빌드)를 다운로드합니다.D:\ComfyUI\ 또는 C:\AI\ComfyUI\ 경로에 압축을 해제합니다. 주의: 폴더 전체 경로에 한글, 공백, 특수문자가 포함되면 실행 및 노드 빌드 시 심각한 오류가 발생합니다.run_nvidia_gpu.bat 파일을 더블 클릭하여 실행합니다. 콘솔 터미널이 구동되며 잠시 후 웹 브라우저(http://127.0.0.1:8188) 인터페이스 창이 자동으로 열립니다.💻 방법 2: ComfyUI Desktop App 설치
일반 사용자 친화적인 데스크톱 애플리케이션 형태의 ComfyUI 설치 방식입니다. 공식 웹사이트나 저장소를 통해 인스톨러 패키지를 내려받아 실행하면 UI 내부에서 독립적인 자동 업데이트 기능을 지원합니다.
🐍 방법 3: Python 가상환경(venv) 기반 수동 설치 (개발자 및 세부 제어용)
가장 고도화된 최신 최적화 라이브러리를 직접 조합 및 튜닝하려는 사용자를 위한 가상환경 수동 설치 절차입니다.
# 1. Python 3.10 ~ 3.12 버전 설치 및 환경변수 등록 확인 python --version # 2. Git 설치 확인 (git-scm.com에서 설치 가능) git --version # 3. ComfyUI 리포지토리 클론 및 이동 cd D:\AI git clone https://github.com/comfyanonymous/ComfyUI.git cd ComfyUI # 4. 독립적인 가상환경(venv) 빌드 및 활성화 python -m venv venv .\venv\Scripts\activate # 5. 최신 PyTorch 및 관련 CUDA 연산 팩 설치 # 최신 RTX 40/50 시리즈 전용 (CUDA 12.8 / cu128 권장) pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu128 # 구형 및 광범위 호환 버전용 (CUDA 12.4 / cu124 안정 버전) # pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124 # 6. 핵심 런타임 의존성 패키지 설치 pip install -r requirements.txt # 7. ComfyUI 서버 최종 구동 테스트 python main.py --port 8188 # 8. GPU 활성화 및 바인딩 최종 검증 코드 python -c "import torch; print(torch.cuda.is_available()); print(torch.cuda.get_device_name(0))"
🔧 실행 배치(.bat) 파일 매개변수 설정법
포터블 폴더나 수동 설치 디렉터리에 커스텀 구동 배치 스크립트를 작성하여 VRAM 부족을 방지하고 최적화를 수행할 수 있습니다.
@echo off rem 가상환경 수동 설치 버전은 하단 활성화 구문 주석 해제하여 사용 rem call .\venv\Scripts\activate rem VRAM 8GB 미만 사양의 필수 VRAM 세이브 옵션 및 실시간 고속 RGB 프리뷰 지정 python main.py --lowvram --preview-method latent2rgb --listen 0.0.0.0 --port 8188 pause
NVIDIA GPU — Linux 설치 완전 가이드
리눅스(Ubuntu 22.04 LTS 기준) 환경은 윈도우 대비 가상 메모리 관리 능력이 탁월하여 이미지 및 영상 생성 시 약 10~15%의 연산 속도 향상을 기대할 수 있습니다.
🐍 Linux 전용 Python 환경 및 CUDA 백엔드 완전 설치 스크립트
# ── 1단계: OS 필수 종속 패키지 및 그래픽 라이브러리 일괄 빌드 ──
sudo apt update && sudo apt install -y \
python3.12 python3.12-venv python3.12-dev \
git wget curl libgl1 libglib2.0-0 \
build-essential
# ── 2단계: 저장소 클론 및 권한 오너십 설정 ──
cd /opt
sudo git clone https://github.com/comfyanonymous/ComfyUI.git
sudo chown -R $USER:$USER ComfyUI
cd ComfyUI
# ── 3단계: 가상환경 초기화 및 활성화 ──
python3.12 -m venv venv
source venv/bin/activate
# ── 4단계: 최신 PyTorch 고속 연산 cu130 / cu128 드라이버 스택 수동 설치 ──
# 최신 하드웨어(RTX 40/50 시리즈 Blackwell 대응용 cu130 빌드)
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu130
# 호환 안정화 빌드 설치 필요 시 아래 선택 가능
# pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu124
# ── 5단계: 프레임워크 요구 의존성 설치 및 하드웨어 인식 테스트 ──
pip install -r requirements.txt
# 하드웨어 정상 매핑 콘솔 확인 검증
python -c "import torch; print(f'CUDA: {torch.cuda.is_available()}, GPU: {torch.cuda.get_device_name(0)}')"
# 백그라운드 상시 수신 대기 서빙 구동 테스트
python main.py --listen 0.0.0.0 --port 8188⚙️ systemd 전용 백그라운드 서비스 상시 등록 가이드
서버 재부팅 시에도 대기 프로세스로 ComfyUI가 백그라운드 자동 유지 구동되도록 데몬 등록을 처리합니다.
[Unit] Description=ComfyUI AI Generation Server Daemon Back-End After=network.target [Service] Type=simple User=ubuntu WorkingDirectory=/opt/ComfyUI ExecStart=/opt/ComfyUI/venv/bin/python main.py --listen 0.0.0.0 --port 8188 --highvram Restart=always RestartSec=10 StandardOutput=syslog StandardError=syslog SyslogIdentifier=comfyui [Install] WantedBy=multi-user.target
# 서비스 설정 재동기화 및 시작 등록 sudo systemctl daemon-reload sudo systemctl enable comfyui.service sudo systemctl start comfyui.service # 실시간 동작 상태 로그 모니터링 출력 명령 sudo journalctl -u comfyui.service -f -n 50
AMD GPU — Windows 설치 가이드 (포터블 · DirectML · WSL2)
AMD 라데온 그래픽카드는 하드웨어 특성상 Linux ROCm 생태계에서 가장 우수한 퍼포먼스를 내지만, 윈도우 환경에서도 2025~2026년 이후 전용 가속 패키지의 비약적 발전과 WSL2 서브시스템 구성을 통해 강력한 도구를 지원받게 되었습니다.
📦 방법 A: AMD 윈도우 전용 포터블 독립 빌드
amd.com/support에 진입하여 시스템에 맞는 최신 정식 아드레날린 드라이버를 클린 설치합니다. (인스톨러 구성 중 ‘ROCm 컴포넌트 포함’ 옵션이 있다면 반드시 선택 동의합니다.)run_amd_gpu.bat 파일을 연계 실행합니다.🛠️ 방법 B: 가상환경 DirectML 수동 백엔드 매핑 스크립트
ROCm 연산 레이어가 완벽하게 상속되지 않는 고전 아키텍처(RX 5000, RX 6000번대 RDNA 1~2 일부 모델) 기기에서 호환 가능한 DirectML 프레임워크 설치 규칙입니다.
# ComfyUI 다운로드 디렉터리 진입 후 가상환경 선언 python -m venv venv .\venv\Scripts\activate # 윈도우 전용 텐서 가속 다이렉트ML 파이토치 엔진 패키지 타겟 설치 pip install torch-directml torchvision torchaudio # 기본 요구 런타임 모듈 구성 설치 pip install -r requirements.txt # 다이렉트ML 디바이스 가속 옵션을 할당하여 ComfyUI 구동 python main.py --directml
🐋 방법 C: WSL2 + 리눅스 ROCm 연산 결합 (파워유저용 최속 권장 경로)
Windows 11 내부에 설치된 WSL2(Ubuntu 22.04) 서브 레이어 안으로 AMD 리눅스용 드라이버를 직접 파이프라인 매핑하여 윈도우 네이티브 대비 가속 연산 성능을 최대 30% 이상 증가시키는 아키텍처 아웃라인입니다. 자세한 내부 명령 스크립트 빌드는 아래 SECTION 06 리눅스 ROCm의 코어 스택 구문을 서브시스템 콘솔 안에서 순차 준용하여 연동해 줍니다.
AMD GPU — Linux 설치 가이드 (ROCm 완전판)
📋 ROCm 공식 지원 대표 가속 GPU 라인업 아키텍처 매트릭스
| 대표 GPU 명칭 | 기반 아키텍처 | ROCm 기본 지원 여부 | 핵심 구동 비고 요약 |
|---|---|---|---|
| RX 7900 XTX / XT | RDNA3 (gfx1100) | 공식 완벽 지원 | 최적의 하드웨어 플래그십 처리 속도 기록 |
| RX 7800 XT / 7700 XT | RDNA3 (gfx1101) | 공식 완벽 지원 | 미들클래스 표준 인공지능 이미지 워크스테이션 |
| RX 7600 / 7600 XT | RDNA3 (gfx1102) | 강제 재매핑 필요 | 구동 타겟 변수 오버라이드 튜닝 필수 적용 |
| RX 6900 XT / 6800 XT | RDNA2 (gfx1030) | 공식 완벽 지원 | 전통 자산 가성비 고용량 VRAM 기기군 |
| RX 6600 / 6700 계열 | RDNA2 (gfx1031) | 강제 재매핑 필요 | 오버라이드 최적화 상속 후 원활 작동 유도 |
🐧 Ubuntu Linux 환경 커널 단 ROCm 7.x 및 드라이버 코어 빌드 셋업
# 1. AMD 공식 레포지토리 키 등록 및 커널 자동 인스톨러 컴파일 패키지 확보 🧬 AMD 인스톨러 다운로드 & 등록 wget https://repo.radeon.com/amdgpu-install/6.3/ubuntu/jammy/amdgpu-install_6.3.60300-1_all.deb sudo dpkg -i amdgpu-install_6.3.60300-1_all.deb sudo apt update # 2. 인공지능 컴퓨팅 딥러닝 컴포넌트 전용 ROCm 레이어 타겟 일괄 컴파일 sudo amdgpu-install --usecase=rocm # 3. 그래픽스 렌더 미디어 가속용 권한 유저 그룹 바인딩 지정 sudo usermod -a -G render,video $USER newgrp render sudo reboot # 4. 하드웨어 드라이버 단 및 장치 매핑 상태 출력 검증 rocm-smi rocminfo | grep -E "Name|gfx" # 5. ComfyUI 전용 리눅스 가상환경 초기 가동 및 ROCm 파이토치 전용 휠 빌드 인스톨 python3 -m venv venv source venv/bin/activate # AMD 전용 ROCm 토치 공식 패키지 명시적 오버 라이드 설치 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.2.4 # 6. 기본 종속 모듈셋 전체 마감 인스톨 pip install -r requirements.txt
🚨 공식 미지원 가속기 커널 강제 바인딩 변수 설정 스크립트
7600 XT나 6700 XT 같은 메인스트림급 대중적 하드웨어는 리눅스 커널이 정식 엔터프라이즈 코어로 즉시 식별하지 못해 에러가 발생할 수 있습니다. 구동 환경 변수 상단에 강제 오버라이드 선언문을 탑재하여 무조건 가속 엔진을 활성화합니다.
# ── RDNA 3 아키텍처 계열 (RX 7600 등) 코어 속성 강제 주입 변수 ── export HSA_OVERRIDE_GFX_VERSION=11.0.0 # ── RDNA 2 아키텍처 계열 (RX 6700, 6600 등) 코어 속성 강제 주입 변수 ── # export HSA_OVERRIDE_GFX_VERSION=10.3.0 # 저사양 VRAM 및 호스트 고정 메모리 충돌 억제 스위치 결합 최종 실행 파일 트리거 python main.py --lowvram --disable-pinned-memory
Intel Arc GPU & CPU 전용 설치
🔵 Intel Arc 전용 통합 가속 패키지 설치법 (Intel Arc A770, B580 대응)
Intel Arc 그래픽스는 전용 PyTorch 확장 모듈인 IPEX (Intel Extension for PyTorch) 및 OneAPI 배포 레이어를 결합하여 탁월한 이미지 추론 속도를 확보할 수 있습니다.
# 인텔 그래픽용 PyTorch 원포인트 인스톨러 매핑 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/xpu # 인텔 원 API 익스텐션(IPEX) 패키지 빌드 셋 업 pip install intel_extension_for_pytorch # 최종 하드웨어 전용 엑셀레이터 탐지 식별 결과 콘솔 검증 python -c "import intel_extension_for_pytorch as ipex; print(ipex.xpu.device_count())" # 원레이어 가속 할당 스위치와 함께 ComfyUI 기동 python main.py
💻 CPU 전용 모드 — 외장 그래픽 엑셀레이터가 완전히 배제된 연산 환경
GPU 자원이 전무한 가상 호스팅 서버 환경이나 로컬 디버깅 목적으로 사용하는 연산 스택 모드입니다. 코어 연산 장치 제약으로 속도는 극도로 정체되므로 단순 테스트 용도로만 사용을 권장합니다.
# 윈도우 포터블 버전 사용자의 경우: 루트 내 run_cpu.bat 더블 클릭 실행 # 수동 일반 리눅스/윈도우 가상환경 구동 버전 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cpu pip install -r requirements.txt # 하드웨어 탐지를 생략하고 호스트 CPU 자원만 강제 제어 바인딩하는 매개변수 주입 python main.py --cpu # ⚠️ 하드웨어 연산 타임 비교 지표 예시 요약: # SDXL 1024×1024 해상도 기준 / 20스텝 연산 처리 시: # 메인스트림 외장 GPU (RTX 4070) 기동 시: 평균 9초 소요 # 고성능 CPU 단독 (Intel i7-13700K / i9-13900K) 강제 구동 시: 평균 3분 ~ 25분(!) 이상 격차 발생
모델 다운로드 & 폴더 구조 완전 가이드
📁 ComfyUI 표준 필수 핵심 디렉터리 폴더 맵 구조 아웃라인
생성 작업 트리가 고장 나지 않도록 다운로드한 대형 모델 에셋을 반드시 약정된 하위 서브 디렉터리에 정확하게 삽입 배치해야 합니다.
ComfyUI/ ├── models/ │ ├── checkpoints/ ← SD1.5, SDXL, SD3.5 전체 병합 기본 체크포인트 공간 │ ├── loras/ ← 캐릭터, 특정 화풍, 스타일 가속 가중치 LoRA 보관 │ ├── vae/ ← 잠재 이미지 색상 변환 왜곡 보정용 필수 VAE 파일 │ ├── controlnet/ ← 포즈, 스케치 엣지, 원근 깊이 제어용 컨트롤넷 에셋 디렉터리 │ ├── clip/ ← FLUX나 SD3.5 등 다중 텍스트 텍스트 인코더 토큰 보관함 │ ├── unet/ ← FLUX 디퓨전 단독 연산 가중치 원본 레이어 보관 디렉터리 │ ├── style_models/ ← IP-Adapter 및 이미지 투 이미지 타겟 참조 레이어 │ ├── video_models/ ← Wan 2.2, HunyuanVideo 고해상도 영상 생성 모델 전문 보관 │ └── animatediff_models/ ← 애니메이트디프 전용 특화 모션 모듈 저장소 ├── input/ ← 이미지 리믹스(img2img), 인페인트 작업 시 사용하는 입력 소스 공간 ├── output/ ← 이미지 연산 처리가 완료된 뒤 메타 정보가 기록되어 자동 격리 저장되는 공간 ├── custom_nodes/ ← 커스텀 확장 기능 플러그인이 적재 설치되는 디렉터리 └── user/ ← 커스텀 환경설정 및 나만의 워크플로우 레이아웃 프리셋 저장소
⬇️ 공식 글로벌 리서치 허브 다운로드 접근 채널 속성
| 데이터 플랫폼 허브 | 플랫폼 고유 배포 성격 | 권장 획득 에셋 종류 |
|---|---|---|
| Civitai.com | 글로벌 최대 오픈 커뮤니티 공간, 한국어 필터링 지원, 세부 메타 포함 | 실사/애니 커스텀 체크포인트 모델, 정교한 테마 LoRA, 예술적 아트워크 스타일 |
| HuggingFace.co | 오픈소스 빅테크 인공지능 연구소 공식 오피셜 아카이브 리포지토리 | 순수 오피셜 FLUX.1 기본 원본, 안정적인 클립 데이터, 대형 비디오 에셋 모델 |
| OpenModelDB | 화질 업스케일링 및 해상도 복원 알고리즘 전문 수집 데이터 보관소 | ESRGAN, SwinIR, RealESRGAN 등 고화질 변환 디테일러 모델 |
🚀 Hugging Face CLI 기반 대형 에셋 고속 백엔드 다운로드 자동 명령셋
# huggingface-cli 라이브러리 가상환경 내 사전 인스톨 pip install huggingface_hub # ── FLUX.1 CLIP 보정 텍스트 인코더 데이터 타겟팅 고속 수신 ── huggingface-cli download comfyanonymous/flux_text_encoders clip_l.safetensors --local-dir ./models/clip huggingface-cli download comfyanonymous/flux_text_encoders t5xxl_fp8_e4m3fn.safetensors --local-dir ./models/clip # ── SDXL 정식 오피셜 기본 베이스 체크포인트 모델 전송 ── huggingface-cli download stabilityai/stable-diffusion-xl-base-1.0 sd_xl_base_1.0.safetensors --local-dir ./models/checkpoints # ── 네트워크 순간 끊김 방지용 이어받기(Resume) 다운로드 매개변수 예시 ── huggingface-cli download black-forest-labs/FLUX.1-dev flux1-dev.safetensors --local-dir ./models/unet --resume-download
🔗 extra_model_paths.yaml — AUTOMATIC1111 웹 UI와 대용량 모델 하드 드라이브 공유 연계 설정
기존에 WebUI 가 사용 중인 수백 GB 이상의 대용량 체크포인트 디렉터리를 중복 다운로드하지 않고 그대로 읽어올 수 있도록 공유 브릿지를 개설해 줍니다.
# 파일 경로 명시 시 역슬래시 단일 기호 혼용 오류 방지를 위해 정방향 슬래시 혹은 이중 기호 권장 a111: base_path: D:/AI/stable-diffusion-webui/ checkpoints: models/Stable-diffusion configs: models/Stable-diffusion vae: models/VAE loras: models/Lora controlnet: models/ControlNet
ComfyUI 인터페이스 & 기본 노드 완전 이해
🖱️ 핵심 캔버스 조작법 및 인터랙션 기초 단축키 요약
| 액션 종류 | 단축키 및 마우스 핸들링 매핑 규칙 | 실전 기능적 효과 요약 |
|---|---|---|
| 노드 간 퀵 서치 | 빈 작업 캔버스 공간 위 마우스 더블 클릭 또는 디스크 Space키 입력 | 검색 팝업 입력창 표출, 즉시 노드 이름 타이핑 추가 가능 |
| 캔버스 무빙 | 마우스 우측 버튼 드래그 혹은 마우스 휠 스크롤 클릭 유지 이동 | 방대한 크기의 그래프 노드 맵 스페이스를 자유롭게 항해 및 추적 |
| 동일 그룹 복제 | 복사 타겟 선택 후 Ctrl + C이후 Ctrl + V (가중치 연계 복사는 Ctrl + Shift + V) | 기존 세팅 데이터 상태 및 연결 파이프라인 구조를 그대로 유지하며 복제 |
| 큐 생성 연산 실행 | Ctrl + Enter | 현재 조립 완료된 그래프 연산 작업을 실행 큐 버퍼로 전송 시작 |
| 큐 실행 강제 해제 | Ctrl + Backspace | 연산 루프 오작동이나 파라미터 오입력 시 진행 중인 작업을 즉시 강제 중단 |
🎛️ 핵심 엔진 KSampler 파라미터 설정 완벽 해독 가이드
| 매개 파라미터 명칭 | 세부 설정 값의 수학적 의미 및 역할 해설 | 주요 모델별 최적 권장 세팅 프리셋 가이드 |
|---|---|---|
| steps | 디디퓨전 잠재 공간의 노이즈를 몇 번에 걸쳐 단계별로 제거 보정해 나갈 것인가 정의 | SD 1.5/XL: 20~30스텝 / FLUX Schnell: 4스텝 고정 / FLUX Dev: 20~25스텝 권장 |
| cfg | 기입한 프롬프트 가이드 지시문에 얼마나 강력하고 엄격하게 귀속되어 형태를 그릴지 제어 | SD 시리즈: 7.0~8.0 표준 / FLUX 라인업: 인공지능 지능 향상으로 3.5~4.0 낮은 수치 권장 |
| sampler_name | 수학적 잠재 공간 노이즈 역추적 샘플링 스케줄링 연산 알고리즘 기법 선택 | 전통 SD 모델: euler_ancestral 혹은 dpm++_2m / FLUX 계열: 순수 euler 솔루션 권장 |
| scheduler | 각 단계별 샘플링 라운드 진행 시 감쇄해 나갈 노이즈 보정 가중치 감폭 분포 법칙 | Stable Diffusion: karras 모델 결합 권장 / FLUX 변환 아키텍처: normal 레이어 고정 세팅 |
| denoise | 입력 데이터 소스의 잠재 노이즈 강도 변경 비율 (img2img 등 변환 시 핵심 활성화) | 1.00 수치는 완전한 무에서 신규 생성 / 0.40~0.60 수치는 원본 구도 골격을 유지하며 변형 |
ComfyUI Manager — 커스텀 노드 완전 가이드
ComfyUI Manager는 외부 개발자가 업로드하는 추가 기능 확장 노드를 통합 검색, 자동 인스톨, 업데이트 및 종속성 복구를 수행해 주는 필수 통제 플러그인 모듈입니다.
🔌 ComfyUI Manager 깃 클론 수동 주입 명령 구문
# ComfyUI 전용 커스텀 확장 노드 디렉터리로 콘솔 이동 cd /opt/ComfyUI/custom_nodes # 또는 윈도우 수동 빌더: cd D:\AI\ComfyUI\custom_nodes # 매니저 원본 리포지토리 복제 아카이빙 git clone https://github.com/Comfy-Org/ComfyUI-Manager.git # 설치 완료 후 ComfyUI 메인 프로세스를 완전히 재기동하면 오측 하단 전용 제어 패널 메뉴가 활성화됩니다.
🔌 필수 커스텀 노드 대표군 기능 성격 분류 요약
| 카테고리 구분 | 정식 커스텀 노드 패키지 명칭 | 실전 장착 유효 주요 핵심 기능 해설 | 우선 장착 필수도 |
|---|---|---|---|
| 인터페이스 및 편의 | rgthree-comfy | 대규모 복잡 노드를 묶는 Fast Grouper, 지능형 북마크, 노드 뮤트 제어 우수 | ⭐⭐⭐⭐⭐ |
| ComfyUI-Custom-Scripts | 자동 보관함, 캔버스 배경 레이아웃 튜닝, 다양한 UI 트릭 요소 탑재 | ⭐⭐⭐⭐ | |
| ComfyUI-Crystools | 상단 바 리얼타임 하드웨어 자원 모니터링(CPU/GPU/VRAM) 헬퍼 내장 | ⭐⭐⭐ | |
| 이미지 복원 및 고도화 | ComfyUI-Impact-Pack | 자동 인물 안면 디테일 복원(Face Detailer), 객체 마스킹 세부 보정 세트 | ⭐⭐⭐⭐⭐ |
| comfyui-blender-nodes / 디테일러 | 화질 업스케일러 타일 분할 제어 처리 보조 | ⭐⭐⭐⭐ | |
| ComfyUI-Ultimate-SD-Upscale | 해상도 타일 분할 기법 기반으로 메모리 터짐 없이 4K 이상 업스케일 가속화 | ⭐⭐⭐⭐⭐ | |
| 영상 및 다이내믹 | ComfyUI-VideoHelperSuite | 비디오 프레임 추출, 오디오 사운드 결합, 생성 비디오 MP4/WebM 인코딩 출력 | ⭐⭐⭐⭐⭐ |
| ComfyUI-Advanced-ControlNet | 정교한 프레임 기반 움직임 모션 가이드 적용 마스킹 처리 셋업 | ⭐⭐⭐⭐ |
🧩 누락 노드(빨간색 경고 박스) 직관적 자동 해결 프로세스
외부 커뮤니티에서 구한 타인의 고도화된 JSON 워크플로우를 드롭했을 때, 내 시스템에 없는 플러그인 노드가 존재하면 시스템이 빨간색 경고창을 띄우며 마비됩니다. 매니저 기능을 이용하면 클릭 몇 번으로 자동 복구가 가능합니다.
Install All을 처리한 뒤 ComfyUI 호스트 프로세스를 리스타트해 주면 모든 빨간 경고 노드가 원상 복구됩니다.실전 워크플로우 10선 — FLUX · SDXL · SD3.5 · 영상
🔥 워크플로우 1 — FLUX.1 Dev 하이엔드 텍스트 투 이미지 스택
[Load Diffusion Model: flux1-dev.safetensors (fp8 또는 GGUF 선택)] ──▶ MODEL [Load CLIP: clip_l.safetensors + t5xxl_fp8.safetensors] ──▶ CLIP [CLIP Text Encode (Positive)] ──▶ CONDITIONING (긍정 프롬프트 텍스트 입력 단) [Empty Latent Image (해상도: 1024×1024 고정 설정)] ──▶ LATENT [Flux Guidance Scale (기본 권장 수치: 3.5)] ──▶ 듀얼 결합 가이드 레이어 [KSampler (Select: euler / normal 스케줄러 세팅)] ──▶ [VAE Decode: ae.safetensors] ──▶ [Save Image]
🔥 워크플로우 2 — FLUX.1 Schnell 초고속 4스텝 완성형 파이프라인
상업적 무료 이용이 가능한 라이트 스택으로, KSampler 설정을 스텝수 4, CFG 수치를 1.0 매칭 형태로 고정 동기화하여 장당 1~2초 내외로 초고속 출력을 실행해 내는 이코노미 구조 맵입니다.
🔥 워크플로우 3 — SDXL 복합 가중치 LoRA 스태킹(Stacking) 제어 구조
[Load Checkpoint] ──▶ [CR Multi-Lora Stack]
├── Lora_A (실사풍 화풍 보정 가중치 강도: 0.60)
└── Lora_B (특정 코스튬 의상 지정 가중치 강도: 0.75)
└── 변환 MODEL / CLIP 상속 연계 ──▶ [KSampler 입력 엔트리 라인 매핑]🔥 워크플로우 4 — 이미지 투 이미지 스타일 트랜스퍼 (img2img)
외부 원본 소스 스케치나 구도 사진 이미지를 Load Image 노드로 수입하여 VAE Encode 과정을 통해 디퓨전 잠재 공간으로 압축 밀어 넣은 뒤, KSampler 단의 Denoise 파라미터를 0.50 내외로 수축 조율하여 원본의 레이아웃 형태를 고스란히 이식 복사해 내는 테크닉 아웃라인입니다.
🔥 워크플로우 5 — Inpainting (특정 국소 영역 정밀 메이크업 복원 수정)
Load Image 공간 위에서 마우스 우측 메뉴 버튼을 눌러 오픈 마스크 에디터(Mask Editor)를 구동한 뒤, 변경을 희망하는 사물이나 눈, 코, 입 부위를 브러시 마스킹 처리하여 해당 잠재 마스크 바인딩 영역 내부만 인공지능이 프롬프트 기반으로 리터칭 렌더링하도록 유도하는 서브 트리 구조입니다.
🔥 워크플로우 6 — ControlNet 인체 포즈 및 하드 엣지 완벽 제어 아키텍처
[Load Image (구도 소스)] ──▶ [AIO Aux Preprocessor (DWPose 전처리 추출)] ──▶ 오픈포즈 뼈대 데이터 메쉬
│
[Apply ControlNet 노드 엔트리 라인 맵] ◀── [Load ControlNet Model (SDXL_OpenPose)] ──┘
│
▼ (정교한 신체 포즈 가이드 정보가 인코딩 상태로 결합)
[KSampler Conditioning 가이드 포트 진입 바인딩]🔥 워크플로우 7 — Ultimate SD Upscale 4K 익스프레스 고해상도 실전 타일 레이어
원본 1024 해상도 결과 소스를 ESRGAN x4 나 SwinIR 복원 인공지능 모델 1차 필터링을 통과 시켜 초고해상도로 뻥튀기한 뒤, Ultimate SD Upscale 커스텀 노드를 장착하여 시스템 VRAM 터짐(OOM) 현상 없이 512 이나 1024 타일 단위로 쪼개어 그리드 미세 디테일 재도색 스캔 연산을 수행해 4K 스케일의 압도적 아트워크를 뽑아냅니다.
🔥 워크플로우 8 — IP-Adapter 이미지 프롬프트 참조 스타일 전사 기법
텍스트 명령어 대신, 참조하고자 하는 특정 인물 전신이나 풍경의 무드 이미지 소스 자체를 인공지능에게 프롬프트 지시문 데이터와 동등한 가중치 토큰 레이어로 입력하여 일관성 있는 얼굴 형태나 일러스트 화풍의 질감을 결과물에 완벽하게 복사 가이드 하는 고급 기법 트리 구성입니다.
🔥 워크플로우 9 — 안면 디테일러(Face Detailer) 자동 보정 자동화 레이아웃
인물 전신 이미지 출력 시 고질적으로 뭉개지고 찌그러지는 먼 거리의 눈동자와 이목구비 영역을 Impact Pack 의 FaceDetailer 노드가 자동으로 크롭 감지 감별하여, 안면 부위만 타겟팅으로 고해상도 업스케일 및 복원 재샘플링 라운드를 고속 패스 처리한 뒤 메인 원본 이미지에 매끄럽게 재합성해 내는 필수 장착 자동화 스택입니다.
🔥 워크플로우 10 — Wan 2.2 / HunyuanVideo 차세대 텍스트 투 비디오 고해상도 시네마틱 영상 스택
[Load Video Model: wan2.2_14b_text2video_fp8.safetensors] ──▶ VIDEO_MODEL
[Wan Video Text Encode (입력 예시: "cinematic drone shot of a neon cyberpunk city street, raining")]
│
▼ (시간축 노이즈 3D 인코딩 매핑)
[WanVideo KSampler (스텝 세팅: 30-40, 프레임 레이트 수치 지정: 81프레임 타겟 연산 수행)]
│
▼
[AnimateDiff / Video VAE Decode 변환] ──▶ [VHS Video Combine 노드 트리거] ──▶ 최종 MP4/WebM 완성 비디오 파일 비주얼 표출성능 최적화 완전 가이드 — xFormers · SageAttention · GGUF
🚀 차세대 고속 텐서 어텐션 가속 엔진 수동 튜닝 컴파일 스크립트
2026년 기준 NVIDIA 및 다양한 가속기 환경에서 연산 효율을 극대화하기 위해 구형 어텐션 구조를 탈피하고 혁신적인 가속 컴포넌트를 이식합니다.
# ── Ampere / Ada 아키텍처 계열 (RTX 30/40 시리즈) 전용 xFormers 탑재 ── pip install xformers # ── 차세대 혁신 어텐션 커널 SageAttention v2/v3 초고속 이식 (빌드 필수 도구 선행 요구) ── # 커널 가속 패키지 컴파일 인스톨 실행 pip install sageattention==2.2.0 # 최신 RTX 50 시리즈 Blackwell 하드웨어 전용 SageAttention v3 초고속 런타임 탑재 코드 # pip install sageattention==3.0.0 # ComfyUI 시스템 설정 진입: Settings → Attention → Use SageAttention 레이어를 ON 체크 활성화합니다. # 📊 벤치마크 추론 연산 속도 변환 지표 데이터 예시 (SDXL, 1024×1024 해상도, RTX 4070 기동 기준) # 순수 순정 노말 초기 구동 상태 (No optimization): 연산 타임 장당 약 18초 소요 # xFormers 커널 인젝션 가속 적용 시: 장당 약 12초 기록 (속도 연산률 33% 획기적 증가 보정) # SageAttention v2 연산 알고리즘 매핑 시: 장당 약 10초 돌파 (44% 속도 업 세이브 확인) # SageAttention v3 (RTX 50 최고 기종 매핑 가속화 시): 장당 약 6초 미만 돌파 기록 확인
💾 시작 스위치 파라미터 조합 VRAM 다이어트 기능 요약
| 구동 실행 인수 매개변수 | 하드웨어 시스템 단 내부 기능적 작동 메커니즘 해설 | 추천 부합 매칭 시스템 VRAM 조건 사양 |
|---|---|---|
--lowvram | 연산 라운드가 종료된 노드의 가중치 데이터를 시스템 VRAM에서 즉시 비우고 일반 호스트 RAM으로 강제 이식 오프로딩 | VRAM 4GB ~ 6GB 사양 사용자 절대 필수 장착 옵션 |
--normalvram | 스마트 캐싱 기법을 발동하여 필요 단위 최소 가중치 세트만 선별 VRAM 로드 유지 | VRAM 8GB ~ 12GB 중간급 보급형 그래픽 카드 표준 스위치 |
--highvram | 모든 대형 모델 에셋 레이어를 VRAM 위에 통째로 고정 상주시켜 컨텍스트 스위칭 지연을 완전 제로화 | VRAM 16GB ~ 24GB+ (RTX 4090 / 5090 등 엔터프라이즈 사양 권장) |
--fp8_e4m3fn | 정밀도 소수점 가중치를 8비트 부동소수점 데이터 구조로 변환 다운사이징 하여 품질 손실 없이 메모리 점유 절반 축소 | VRAM 8GB ~ 12GB 사양에서 FLUX 대형 모델 구동 시 필수 권장 옵션 |
--disable-smart-memory | 내장 지능형 다이내믹 메모리 타겟 로드 통제 스위치를 정지시키고 클래식 완전 수동 제어로 환원 | 특정 노드 간 충돌로 인한 런타임 프리징 에러 발생 시 디버깅 용도 활용 |
📉 GGUF 비트 양자화 모델 솔루션 — 저VRAM 카드에서 대형 FLUX 인공지능 정밀 구동하기
과거 대형 언어 모델(LLM)에서 연산 포화를 막기 위해 사용하던 고도화된 GGUF 양자화 압축 압축 가속 아키텍처를 이미지 생성 디퓨전 유넷 단에 직접 투영한 기술입니다. 품질 열화는 인간의 육안 분별 한계점 미만으로 억제하면서 모델 무거움을 절반 이하로 상쇄 시켜 줍니다.
| GGUF 양자화 모델 비트 등급 구분 | 컴포넌트 실제 디스크 용량 크기 | 안정 구동 마지노선 소요 VRAM | 출력 화질 픽셀 텍스처 정밀도 손실 수준 평가 |
|---|---|---|---|
| FLUX.1 Dev 원본 가중치 (bf16) | 약 24 GB | VRAM 24 GB 이상급 기기 단 독점 권장 | 품질 손실 없음 오피셜 오리지널 정밀 지표 |
| FLUX.1 Dev fp8 압축 공정 버전 | 약 12 GB | VRAM 12 GB 권장 사양 | 미세한 노이즈 레벨 외 차이 구별 불가 쾌적 성능 확보 |
| FLUX.1 Dev GGUF Q8 비트 버전 | 약 12.5 GB | VRAM 10 GB ~ 12 GB 표준 카드군 | 원본 bf16 등급 대비 수학적 유사도 99% 완벽 수렴 일치 |
| FLUX.1 Dev GGUF Q4_K_S 비트 버전 | 약 6.4 GB | VRAM 6 GB ~ 8 GB 엔트리 보급형 라인 | 배경 텍스처 묘사 단에서 미세 열화가 있으나 캐릭터 표현 우수 |
| FLUX.1 Dev GGUF Q2_K 초압축 버전 | 약 3.7 GB | VRAM 4 GB 극한 가성비 환경 작동 성공 | 해상도 디테일 왜곡 무너짐 현상이 관측되나 생성이 무조건 작동함 |
원격 운영 & API 서버 활용 · 자동화
🔌 내장 웹소켓 백엔드 비동기 통신 제어 기술 아웃라인
ComfyUI는 프론트엔드 UI 화면 뒤편으로 완전한 REST API 형태의 HTTP 리스닝 서버 및 WebSocket 채널이 빌트인 설계되어 있습니다. 외부 파이썬 스크립트나 n8n, Dify 등의 자동화 도구를 결합하여 기업형 자동 생성 파이프라인을 구축할 수 있습니다.
import json
import urllib.request
import uuid
import websocket # 패키지 선행 인스톨 필수: pip install websocket-client
SERVER_ADDR = "127.0.0.1:8188"
CLIENT_UUID = str(uuid.uuid4())
def send_generation_queue(workflow_json_map: dict):
"""지정 워크플로우를 ComfyUI 내부 매니징 연산 큐 버퍼에 직접 주입 코드"""
payload_bytes = json.dumps({"prompt": workflow_json_map, "client_id": CLIENT_UUID}).encode('utf-8')
req = urllib.request.Request(f"http://{SERVER_ADDR}/prompt", data=payload_bytes, headers={'Content-Type': 'application/json'})
return json.loads(urllib.request.urlopen(req).read().decode('utf-8'))
# 워크플로우 API 내보내기 기능으로 추출한 JSON 맵 파일 로드 처리 파트
with open("my_flux_standard_api.json", "r", encoding="utf-8") as f:
target_workflow = json.load(f)
# 특정 노드 번호 아이디의 프롬프트 명령어 입력 벨류 매개변수를 코드 단에서 동적 제어 오버라이딩
target_workflow["6"]["inputs"]["text"] = "a beautiful ultra-realistic cybernetic humanoid goddess, 8k photo neon light"
target_workflow["3"]["inputs"]["seed"] = 8881234912 # 시드 일치 고정화 제어
# 이미지 발송 통제 지시 트리거 구동
response_data = send_generation_queue(target_workflow)
print(f"ComfyUI 엔지니어링 큐 접수 완료! 할당 작업 발급 ID: {response_data['prompt_id']}")🔗 워크플로우 저장 및 외부 플랫폼 연동 기술 응용 활용법
- ✓API 전용 JSON 스키마 내보내기 팁: UI 우측 설정 기어 아이콘을 누르고 `Enable Dev mode`를 체크하면 우측 패널 메뉴 단에 Save (API Format) 버튼이 추가 생성됩니다. 일반 디스크 저장용 JSON 과 달리 순수 노드 연산 데이터 파싱 관계 레이아웃만 남겨주므로 외부 소스코드 연동 시 필수 절차입니다.
- ✓n8n / Dify 엔터프라이즈 인공지능 워크플로우 결합: 인바운드 HTTP 노드를 ComfyUI API `/prompt` 수신 엔드포인트와 연결 스케줄링 동기화해 둠으로써, 사내 슬랙 메신저 챗봇 프롬프트 입력 유입 즉시 자동으로 사내 GPU 서버 워크플로우를 가동하여 완성 이미지를 슬랙 채널로 리턴하는 고도의 커스텀 생성 자동화 인프라를 실현할 수 있습니다.
트러블슈팅 — GPU별 자주 발생하는 오류 완전 해결
🔧 대표 빈발 에러 증상 원인 매핑 및 클린 물리적 극복 해결법 완전판
| 콘솔 출력 에러 구문 및 핵심 리포트 | 발생하게 되는 하드웨어/소프트웨어적 핵심 원인 | 즉각 대처 및 정상 복구 극복 조치 방법 해설 | 주요 발생 대상 GPU군 |
|---|---|---|---|
CUDA out of memory (OOM) | 설정한 생성 이미지 해상도가 너무 무겁거나 대형 bf16 모델이 VRAM 가용 용량을 초과 점유하여 충돌 | 구동 배치 파일 옵션 인수에 --lowvram 또는 --fp8_e4m3fn 장착, 혹은 경량 양자화 GGUF 모델로 전면 교체 적용 | NVIDIA / AMD 윈도우 보급형 공통 (4GB~8GB 라인) |
Torch not compiled with CUDA enabled | Python 전용 가상 가상환경 내부에 인공지능 그래픽 연산 CUDA 엑셀레이터 드라이버가 배제된 순수 CPU 용 PyTorch 휠이 잘못 인스톨 된 상태 | 가상환경 활성화 후 공식 설치 명령 라인인 --index-url https://download.pytorch.org/whl/cu128 플래그를 정확하게 선언하여 정식 CUDA 전용 가중치 토치 패키지를 재인스톨 완료 | NVIDIA 수동 환경 입문 빌더 공통 |
Cannot find gfx아키텍처 아웃라인 / HIP 장치 인식 실패 | Linux 커널이 메인스트림 AMD 라데온 하드웨어 칩셋 연산 코어를 식별하지 못해 하드웨어 하이 레벨에서 드롭 처리 에러 | 환경 변수 상단 파일 스크립트 단에 명시적으로 export HSA_OVERRIDE_GFX_VERSION=11.0.0 오버라이드 코드를 하드코딩 밀어 넣은 뒤 프로세스 재기동 | AMD 라데온 전 라인업 (특히 RX 7600, 6700 등) |
ModuleNotFoundError: No module named '노드명' | 타인의 JSON 워크플로우를 그대로 유입 가동했으나 해당 처리를 서포트해 줄 커스텀 라이브러리 노드가 현재 내 custom_nodes 디렉터리에 다운로드 안 됨 | 우측 ComfyUI Manager 버튼 진입 -> Install Missing Custom Nodes 메뉴 클릭하여 자동 검색 식별 연계 처리 후 일괄 리인스톨 복구 | OS 하드웨어 불문 전체 공통 사항 |
| 검은색 무지의 공백 이미지만 생성 출력 완료되는 현상 | FLUX 이나 SDXL 모델 기동 시 아키텍처 연산 공식 규격과 전혀 매칭 부합하지 않는 이종 세대의 VAE 보정 모델 파일을 잘못 체이닝 결합 유입시킨 원인 | FLUX 계열 모델 기동 시에는 반드시 전용으로 설계 고안된 단독 VAE 파일인 ae.safetensors 에셋 노드를 정확히 로드 결합해야 정상 컬러 발색 확인 완료 | 전체 하드웨어 공통 아웃라인 |
💡 실전 사용 파워유저 노하우 비밀 팁 모음
- ✓워크플로우의 최고 공유 수단은 원본 PNG 이미지: ComfyUI로 생성해 내는 최종 아웃풋 PNG 그림 파일 내부 메타 헤더 데이터 단에는 당시 조립 설계했던 노드 파이프라인 JSON 전체 맵 코드가 투명하게 자동 임베디드 백업됩니다. 이 PNG 이미지를 타인의 빈 캔버스 창 위에 드롭다운 마우스 투하만 해 주면 당시에 사용했던 체크포인트 값과 세부 설정 노드 맵 전체가 100% 한 번에 완벽하게 리스토어 복원 복구됩니다.
- ✓Primitive 고정 노드를 활용한 완벽한 벤치 비교 환경 셋업: Seed 파라미터 제어 포트를 마우스 우측 클릭하여 입력단 단자로 전환(Convert to input)한 뒤, `Primitive` 유틸리티 노드를 브릿지 개설 연동해 두면 시드 번호가 완전하게 제어 고정됩니다. 이 상태를 박제한 뒤 우측 LoRA 강도나 프롬프트 단락 어휘 수치만 가변 튜닝 변경해 가며 결과물 화질을 과학적으로 정밀 실험 비교 분석할 수 있습니다.
- ✓다중 배치(Batch) 처리 구성을 통과한 가속화 꿀팁: Empty Latent Image 설정창 내부의 `batch_size` 밸류 인덱스를 기본 1에서 4 형태로 증가 할당해 주면 하드웨어 그래픽 연산 코어가 한 라운드 큐 싸이클 내부에서 4장의 일러스트 도화를 한 번에 묶어 동시 텐서 연산 추론을 처리하므로 단독 장당 반복 구동 대비 GPU 자원의 코어 활성 연산 효율성을 최대 극대화할 수 있습니다.
