Open WebUI 완벽 가이드 — 5편 시리즈
글 2에서 다루는 내용
최초 접속 및 초기 설정
Open WebUI 초기 설정은 설치 직후 가장 먼저 완료해야 하는 단계입니다. 특히 외부 공개 서버라면 관리자 계정 생성 직후 보안 설정을 5분 안에 완료해야 합니다. 초기 설정을 미루면 누구나 회원가입해 무제한으로 AI를 사용하는 상황이 발생할 수 있습니다.
🔑 관리자 계정 생성 — 첫 번째 가입자가 Admin
http://서버IP:3000 접속 → 회원가입 화면 표시. 이미지 없이 텍스트 폼만 나온다면 정상입니다.Open WebUI는 기본적으로 누구나 가입할 수 있습니다. 외부 공개 상태라면 봇·크롤러가 가입해 OpenAI API를 무제한으로 사용할 수 있습니다. API 비용 폭탄을 막으려면 설치 직후 반드시 회원가입을 제한하세요.
🛡️ 필수 보안 설정 (Admin Panel)
우상단 아바타 → Admin Panel → Settings → General에서 아래 3가지를 설정합니다.
- ✓Default User Role → Pending 변경 — 신규 가입자를 관리자가 수동 승인해야 사용 가능하게 설정. 팀 운영 필수.
- ✓Enable New Sign Ups → OFF — 혼자 쓰거나 가입을 완전 차단할 때. 초대 링크도 비활성화됩니다.
- ✓JWT Expiration 설정 — 기본 1시간. 내부망 단독 사용이면
-1(무제한)도 가능. 외부 공개라면 기본값 유지.
🖥️ UI 구조 빠른 파악
| 영역 | 위치 | 주요 기능 |
|---|---|---|
| 사이드바 | 화면 왼쪽 | 대화 목록 · 새 채팅 · 폴더 정리 · 즐겨찾기 · Workspace |
| 모델 선택기 | 채팅 상단 중앙 | 연결된 모든 모델 드롭다운 · + 버튼으로 멀티모델 비교 |
| 채팅 입력창 | 하단 중앙 | 메시지 · 파일 첨부(📎) · 음성 입력(🎤) · 웹 검색 토글 |
| 사용자 메뉴 | 우상단 아바타 | Settings · Admin Panel · 로그아웃 |
| Admin Panel | 아바타 → Admin Panel | 사용자 관리 · 모델 설정 · 사용 통계 · 보안 설정 |
🌐 한국어 설정 & 기본 환경 설정
우상단 아바타 → Settings → General → Language → 한국어 선택. 저장 즉시 반영됩니다. 다크/라이트 모드는 우상단 달 아이콘(☾) 클릭으로 즉시 전환 가능합니다.
👥 사용자 역할 구조
| 역할 | 권한 수준 | 설명 |
|---|---|---|
| Admin | 전체 권한 | 시스템 설정·사용자 관리·모든 기능. 첫 번째 가입자에게 자동 부여. |
| User | 일반 사용 | 채팅·파일 업로드·허용된 모델 사용. Admin 승인 후 활성화. |
| Pending | 대기 중 | 가입 완료 상태이나 Admin 승인 전. 서비스 이용 불가. |
Open WebUI Ollama 연결 & 모델 관리
Open WebUI Ollama 연결은 글 1에서 Docker Compose로 함께 설치했다면 자동으로 완료되어 있습니다. 연결이 안 된다면 OLLAMA_BASE_URL 설정 문제가 95%입니다. 연결 확인 후 AI 모델을 다운로드해야 실제로 채팅이 가능합니다. 모델 다운로드는 인터넷 속도에 따라 수 분~수십 분 소요됩니다.
🔌 Ollama 연결 상태 확인
http://ollama:11434docker compose ps로 ollama 컨테이너 Up 상태 확인 → docker compose logs ollama로 오류 원인 파악 → 글 5 트러블슈팅 참고📥 모델 다운로드 방법 2가지
방법 A — Open WebUI UI에서 직접 (추천)
Admin Panel → Models → Pull a model from Ollama.com 입력창에 모델명 입력 → 다운로드. 진행률이 실시간으로 표시되며, 다운로드 중에도 채팅 사용이 가능합니다.
# Ollama 컨테이너에 접속 docker exec -it ollama bash # 모델 다운로드 (예시) ollama pull qwen2.5:7b # RTX 3060 추천 ollama pull nomic-embed-text # RAG 임베딩 필수 # 다운로드된 모델 목록 확인 ollama list # 컨테이너 나가기 exit
🤖 Open WebUI 추천 모델 목록 (2025년 기준)
| 모델명 | 파일 크기 | 필요 VRAM | 특징 | 추천 용도 |
|---|---|---|---|---|
qwen2.5:7b | ~5GB | 6~8GB | 한국어·코딩 우수, 빠른 속도 | RTX 3060 추천 |
qwen2.5:14b | ~9GB | 10~12GB | qwen2.5:7b보다 뛰어난 추론 | RTX 3080/4070 |
gemma3:12b | ~8GB | 10GB | Google DeepMind, 멀티모달 지원 | 이미지 분석 |
gemma3:27b | ~17GB | 20GB | Gemma 최강, 고품질 추론 | RTX 3090/4090 |
llama3.2:3b | ~2GB | 4GB | 경량, 빠른 응답 | 저사양 / 테스트 |
deepseek-r1:8b | ~5GB | 8GB | 추론 특화, 수학·코딩 우수 | 코딩 / 수학 |
mistral:7b | ~4GB | 6GB | 빠른 속도, 영문 전문 작업 | 영문 작업 |
nomic-embed-text | ~274MB | 1GB 미만 | RAG 임베딩 전용 | RAG 필수 |
- 8GB VRAM (RTX 3060 8GB / RTX 4060) —
qwen2.5:7b+nomic-embed-text - 12GB VRAM (RTX 3060 12GB / RTX 3080) —
gemma3:12b또는qwen2.5:7b+nomic-embed-text - 24GB VRAM (RTX 3090 / RTX 4090) —
gemma3:27b또는qwen2.5:14b고품질 운영 - GPU 없음 (CPU 전용) —
llama3.2:3b(느리지만 동작) 또는 외부 API 연동 추천
- 모델을 다운받지 않고 채팅 시도 — 모델 선택기가 비어있거나 오류가 납니다.
ollama list로 모델 존재 여부 먼저 확인. - 모델 크기가 VRAM 초과 — CPU로 자동 전환되어 응답이 수십 배 느려집니다.
ollama ps명령어로 GPU 사용 여부 확인. - 모델명 오타 —
ollama pull qwen2.5:7b처럼 정확한 태그 포함해서 입력해야 합니다. Ollama.com에서 정확한 이름 확인.
OpenAI API 연결 & 비용 관리
Open WebUI OpenAI API 연결은 API Key 하나만 있으면 2분 안에 완료됩니다. 연결 후에는 GPT-4o, o3 등 OpenAI의 모든 모델이 자동으로 목록에 추가됩니다. 중요한 것은 비용 관리입니다. API 사용량 한도를 설정하지 않으면 예상치 못한 금액이 청구될 수 있습니다.
🔑 API Key 등록 순서
platform.openai.com → API keys → Create new secret key. 발급 후 즉시 복사하세요. 다시 확인 불가합니다.https://api.openai.com/v1 유지.📊 주요 GPT 모델 비교 및 선택 가이드
| 모델 | 입력 비용 | 출력 비용 | 컨텍스트 | 추천 상황 |
|---|---|---|---|---|
gpt-4o | $2.50/1M | $10.00/1M | 128K | 중요 문서 분석, 이미지 포함 작업 |
gpt-4o-mini | $0.15/1M | $0.60/1M | 128K | 일상 채팅, 간단한 작업. 가성비 최고 |
o3-mini | $1.10/1M | $4.40/1M | 200K | 수학·코딩·논리 추론 특화 |
gpt-3.5-turbo | $0.50/1M | $1.50/1M | 16K | 초저가, 단순 반복 작업 |
- Default Model → gpt-4o-mini 설정. 일상 작업은 mini로, 중요한 분석만 gpt-4o 선택 (비용 약 17배 차이)
- Admin Panel → 사용자별 모델 제한 — 일반 사용자에게 gpt-4o-mini만 허용, Admin만 gpt-4o 사용 가능하게 설정
- System Prompt 최소화 — 매 요청마다 System Prompt 토큰이 소모됩니다. 불필요한 내용은 제거
- 로컬 모델 병행 — 간단한 요약·분류는 Ollama 로컬 모델로, 복잡한 추론만 GPT-4o로 분리 운영
외부 모델 연동 — Claude · Groq · Gemini · OpenRouter
Open WebUI는 OpenAI API 호환 형식을 지원하는 모든 서비스와 연동됩니다. Admin Panel → Settings → Connections에서 새 OpenAI 호환 API를 추가하면, 하나의 Open WebUI에서 OpenAI, Claude, Gemini, Groq를 동시에 사용할 수 있습니다. 실제 운영에서는 업무 성격에 따라 모델을 선택하는 방식으로 활용합니다.
🌐 OpenRouter — 100개 이상 모델을 Key 하나로
OpenRouter는 Claude, Gemini, Llama, Qwen 등 100개 이상의 모델을 하나의 API Key로 통합 사용할 수 있는 서비스입니다. 일부 모델은 무료로 제공하며, 모델별 비용·속도·품질을 한 곳에서 비교할 수 있어 Open WebUI와 함께 가장 많이 사용하는 조합입니다.
| 항목 | 값 |
|---|---|
| Base URL | https://openrouter.ai/api/v1 |
| API Key 발급 | openrouter.ai/keys (무료 가입) |
| 추천 무료 모델 | meta-llama/llama-3.3-70b-instruct:free, google/gemma-3-27b-it:free |
⚡ Groq — 무료 티어 + 초고속 응답
Groq는 LPU(Language Processing Unit) 기반으로 일반 GPU 대비 응답 속도가 10배 이상 빠릅니다. Llama 3.3 70B 모델을 무료(분당 요청 제한)로 제공해 Open WebUI 무료 운영의 핵심 선택지입니다. 속도가 빠른 만큼 채팅 인터페이스에서 타이핑하듯 스트리밍되는 느낌이 납니다.
| 항목 | 값 |
|---|---|
| Base URL | https://api.groq.com/openai/v1 |
| API Key 발급 | console.groq.com (무료) |
| 추천 모델 | llama-3.3-70b-versatile (무료), gemma2-9b-it (무료) |
🧠 Anthropic Claude — 최고 품질의 추론과 글쓰기
Claude API는 긴 문서 분석, 코드 리뷰, 고품질 글쓰기 작업에서 GPT-4o와 함께 가장 높은 평가를 받습니다. Open WebUI v0.5 이상에서는 Anthropic API 전용 연결 입력란이 분리되어 있어 더 안정적으로 연동됩니다.
| 항목 | 값 |
|---|---|
| Base URL | https://api.anthropic.com/v1 |
| API Key 발급 | console.anthropic.com |
| 추천 모델 | claude-sonnet-4-6 (성능/비용 균형), claude-opus-4-6 (최고 성능) |
🔮 Google Gemini — 무료 티어 + 멀티모달
| 항목 | 값 |
|---|---|
| Base URL | https://generativelanguage.googleapis.com/v1beta/openai/ |
| API Key 발급 | aistudio.google.com (무료) |
| 추천 모델 | gemini-2.0-flash (무료·빠름), gemini-2.5-pro (최고 성능) |
- 일상 채팅 · 빠른 답변 — Groq
llama-3.3-70b(무료, 초고속) - 긴 문서 분석 · 정밀한 글쓰기 — Claude
claude-sonnet-4-6 - 코딩 · 수학 · 추론 — OpenAI
o3-mini또는 Ollamadeepseek-r1:8b - 이미지 분석 — OpenAI
gpt-4o또는 Claudeclaude-sonnet-4-6 - 비용 0원으로 운영 — Groq + OpenRouter 무료 모델 조합
- 완전한 프라이버시 — Ollama 로컬 모델 단독 운영
채팅창 상단 모델 선택기에서 Ollama 로컬 모델과 GPT, Claude, Gemini, Groq를 자유롭게 전환하며 사용할 수 있습니다.
