Open WebUI 초기 보안 설정 및 Ollama, OpenAI API 연결 가이드 (2/5)

시리즈글 2 / 5
업데이트2025년 5월
버전Open WebUI v0.6.x
난이도초급
전제글 1 설치 완료
Open WebUI 초기설정 Open WebUI Ollama 연결 OpenAI API Claude API Groq 무료 API
Open WebUI 설치를 완료했다면 이제 첫 관리자 계정을 만들고 AI 모델을 연결할 차례입니다. 이 글에서는 처음 접속 시 반드시 해야 할 보안 설정부터, Ollama 로컬 모델 연결, OpenAI GPT, Anthropic Claude, Groq까지 모든 모델 연결 방법을 순서대로 정리합니다.
SECTION01

최초 접속 및 초기 설정

Open WebUI 초기 설정은 설치 직후 가장 먼저 완료해야 하는 단계입니다. 특히 외부 공개 서버라면 관리자 계정 생성 직후 보안 설정을 5분 안에 완료해야 합니다. 초기 설정을 미루면 누구나 회원가입해 무제한으로 AI를 사용하는 상황이 발생할 수 있습니다.

🔑 관리자 계정 생성 — 첫 번째 가입자가 Admin

1
브라우저에서 접속
http://서버IP:3000 접속 → 회원가입 화면 표시. 이미지 없이 텍스트 폼만 나온다면 정상입니다.
2
이름·이메일·비밀번호 입력 후 가입
가장 먼저 가입한 계정이 자동으로 Admin(관리자)이 됩니다. 반드시 본인이 첫 번째로 가입하세요.
3
즉시 보안 설정 진행
로그인 직후 아래 보안 설정 섹션의 3가지를 완료해야 합니다. 외부 공개 서버라면 5분 이내로 끝내세요.
🚨
외부 공개 서버 — 설치 직후 즉시 보안 설정 필수

Open WebUI는 기본적으로 누구나 가입할 수 있습니다. 외부 공개 상태라면 봇·크롤러가 가입해 OpenAI API를 무제한으로 사용할 수 있습니다. API 비용 폭탄을 막으려면 설치 직후 반드시 회원가입을 제한하세요.

🛡️ 필수 보안 설정 (Admin Panel)

우상단 아바타 → Admin Panel → Settings → General에서 아래 3가지를 설정합니다.

  • Default User Role → Pending 변경 — 신규 가입자를 관리자가 수동 승인해야 사용 가능하게 설정. 팀 운영 필수.
  • Enable New Sign Ups → OFF — 혼자 쓰거나 가입을 완전 차단할 때. 초대 링크도 비활성화됩니다.
  • JWT Expiration 설정 — 기본 1시간. 내부망 단독 사용이면 -1(무제한)도 가능. 외부 공개라면 기본값 유지.

🖥️ UI 구조 빠른 파악

영역위치주요 기능
사이드바화면 왼쪽대화 목록 · 새 채팅 · 폴더 정리 · 즐겨찾기 · Workspace
모델 선택기채팅 상단 중앙연결된 모든 모델 드롭다운 · + 버튼으로 멀티모델 비교
채팅 입력창하단 중앙메시지 · 파일 첨부(📎) · 음성 입력(🎤) · 웹 검색 토글
사용자 메뉴우상단 아바타Settings · Admin Panel · 로그아웃
Admin Panel아바타 → Admin Panel사용자 관리 · 모델 설정 · 사용 통계 · 보안 설정

🌐 한국어 설정 & 기본 환경 설정

우상단 아바타 → Settings → General → Language → 한국어 선택. 저장 즉시 반영됩니다. 다크/라이트 모드는 우상단 달 아이콘(☾) 클릭으로 즉시 전환 가능합니다.

👥 사용자 역할 구조

역할권한 수준설명
Admin전체 권한시스템 설정·사용자 관리·모든 기능. 첫 번째 가입자에게 자동 부여.
User일반 사용채팅·파일 업로드·허용된 모델 사용. Admin 승인 후 활성화.
Pending대기 중가입 완료 상태이나 Admin 승인 전. 서비스 이용 불가.
SECTION02

Open WebUI Ollama 연결 & 모델 관리

Open WebUI Ollama 연결은 글 1에서 Docker Compose로 함께 설치했다면 자동으로 완료되어 있습니다. 연결이 안 된다면 OLLAMA_BASE_URL 설정 문제가 95%입니다. 연결 확인 후 AI 모델을 다운로드해야 실제로 채팅이 가능합니다. 모델 다운로드는 인터넷 속도에 따라 수 분~수십 분 소요됩니다.

🔌 Ollama 연결 상태 확인

1
Admin Panel → Settings → Connections
Ollama API URL 항목에 연결 주소가 표시됩니다. Docker Compose 사용 시 기본값: http://ollama:11434
2
새로고침(↺) 버튼 클릭
URL 오른쪽 화살표 버튼 클릭 → 초록색 체크(✓)가 표시되면 연결 성공. 빨간 X면 URL 또는 네트워크 오류.
!
빨간 X가 뜬다면?
docker compose ps로 ollama 컨테이너 Up 상태 확인 → docker compose logs ollama로 오류 원인 파악 → 글 5 트러블슈팅 참고

📥 모델 다운로드 방법 2가지

방법 A — Open WebUI UI에서 직접 (추천)
Admin Panel → Models → Pull a model from Ollama.com 입력창에 모델명 입력 → 다운로드. 진행률이 실시간으로 표시되며, 다운로드 중에도 채팅 사용이 가능합니다.

bash — 방법 B: Ollama 컨테이너 CLI
# Ollama 컨테이너에 접속
docker exec -it ollama bash
 
# 모델 다운로드 (예시)
ollama pull qwen2.5:7b           # RTX 3060 추천
ollama pull nomic-embed-text     # RAG 임베딩 필수
 
# 다운로드된 모델 목록 확인
ollama list
 
# 컨테이너 나가기
exit

🤖 Open WebUI 추천 모델 목록 (2025년 기준)

모델명파일 크기필요 VRAM특징추천 용도
qwen2.5:7b~5GB6~8GB한국어·코딩 우수, 빠른 속도RTX 3060 추천
qwen2.5:14b~9GB10~12GBqwen2.5:7b보다 뛰어난 추론RTX 3080/4070
gemma3:12b~8GB10GBGoogle DeepMind, 멀티모달 지원이미지 분석
gemma3:27b~17GB20GBGemma 최강, 고품질 추론RTX 3090/4090
llama3.2:3b~2GB4GB경량, 빠른 응답저사양 / 테스트
deepseek-r1:8b~5GB8GB추론 특화, 수학·코딩 우수코딩 / 수학
mistral:7b~4GB6GB빠른 속도, 영문 전문 작업영문 작업
nomic-embed-text~274MB1GB 미만RAG 임베딩 전용RAG 필수
✅ VRAM별 최적 조합 (실제 운영 기준)
  • 8GB VRAM (RTX 3060 8GB / RTX 4060)qwen2.5:7b + nomic-embed-text
  • 12GB VRAM (RTX 3060 12GB / RTX 3080)gemma3:12b 또는 qwen2.5:7b + nomic-embed-text
  • 24GB VRAM (RTX 3090 / RTX 4090)gemma3:27b 또는 qwen2.5:14b 고품질 운영
  • GPU 없음 (CPU 전용)llama3.2:3b (느리지만 동작) 또는 외부 API 연동 추천
⚠️ Open WebUI Ollama 연결 시 흔한 실수
  • 모델을 다운받지 않고 채팅 시도 — 모델 선택기가 비어있거나 오류가 납니다. ollama list로 모델 존재 여부 먼저 확인.
  • 모델 크기가 VRAM 초과 — CPU로 자동 전환되어 응답이 수십 배 느려집니다. ollama ps 명령어로 GPU 사용 여부 확인.
  • 모델명 오타ollama pull qwen2.5:7b처럼 정확한 태그 포함해서 입력해야 합니다. Ollama.com에서 정확한 이름 확인.
SECTION03

OpenAI API 연결 & 비용 관리

Open WebUI OpenAI API 연결은 API Key 하나만 있으면 2분 안에 완료됩니다. 연결 후에는 GPT-4o, o3 등 OpenAI의 모든 모델이 자동으로 목록에 추가됩니다. 중요한 것은 비용 관리입니다. API 사용량 한도를 설정하지 않으면 예상치 못한 금액이 청구될 수 있습니다.

🔑 API Key 등록 순서

1
OpenAI API Key 발급
platform.openai.com → API keys → Create new secret key. 발급 후 즉시 복사하세요. 다시 확인 불가합니다.
2
Open WebUI에 등록
Admin Panel → Settings → Connections → OpenAI API → Key 입력. Base URL은 기본값 https://api.openai.com/v1 유지.
3
저장 후 모델 확인
Save 클릭 → 채팅창 상단 모델 선택기에 gpt-4o, gpt-4o-mini 등이 자동으로 로드됩니다.
!
사용량 한도 설정 (반드시)
platform.openai.com → Billing → Usage limits → Hard limit 설정. 월 최대 지출 금액을 여기서 제한합니다.

📊 주요 GPT 모델 비교 및 선택 가이드

모델입력 비용출력 비용컨텍스트추천 상황
gpt-4o$2.50/1M$10.00/1M128K중요 문서 분석, 이미지 포함 작업
gpt-4o-mini$0.15/1M$0.60/1M128K일상 채팅, 간단한 작업. 가성비 최고
o3-mini$1.10/1M$4.40/1M200K수학·코딩·논리 추론 특화
gpt-3.5-turbo$0.50/1M$1.50/1M16K초저가, 단순 반복 작업
✅ 비용 절감 실전 팁
  • Default Model → gpt-4o-mini 설정. 일상 작업은 mini로, 중요한 분석만 gpt-4o 선택 (비용 약 17배 차이)
  • Admin Panel → 사용자별 모델 제한 — 일반 사용자에게 gpt-4o-mini만 허용, Admin만 gpt-4o 사용 가능하게 설정
  • System Prompt 최소화 — 매 요청마다 System Prompt 토큰이 소모됩니다. 불필요한 내용은 제거
  • 로컬 모델 병행 — 간단한 요약·분류는 Ollama 로컬 모델로, 복잡한 추론만 GPT-4o로 분리 운영
SECTION04

외부 모델 연동 — Claude · Groq · Gemini · OpenRouter

Open WebUI는 OpenAI API 호환 형식을 지원하는 모든 서비스와 연동됩니다. Admin Panel → Settings → Connections에서 새 OpenAI 호환 API를 추가하면, 하나의 Open WebUI에서 OpenAI, Claude, Gemini, Groq를 동시에 사용할 수 있습니다. 실제 운영에서는 업무 성격에 따라 모델을 선택하는 방식으로 활용합니다.

🌐 OpenRouter — 100개 이상 모델을 Key 하나로

OpenRouter는 Claude, Gemini, Llama, Qwen 등 100개 이상의 모델을 하나의 API Key로 통합 사용할 수 있는 서비스입니다. 일부 모델은 무료로 제공하며, 모델별 비용·속도·품질을 한 곳에서 비교할 수 있어 Open WebUI와 함께 가장 많이 사용하는 조합입니다.

항목
Base URLhttps://openrouter.ai/api/v1
API Key 발급openrouter.ai/keys (무료 가입)
추천 무료 모델meta-llama/llama-3.3-70b-instruct:free, google/gemma-3-27b-it:free

⚡ Groq — 무료 티어 + 초고속 응답

Groq는 LPU(Language Processing Unit) 기반으로 일반 GPU 대비 응답 속도가 10배 이상 빠릅니다. Llama 3.3 70B 모델을 무료(분당 요청 제한)로 제공해 Open WebUI 무료 운영의 핵심 선택지입니다. 속도가 빠른 만큼 채팅 인터페이스에서 타이핑하듯 스트리밍되는 느낌이 납니다.

항목
Base URLhttps://api.groq.com/openai/v1
API Key 발급console.groq.com (무료)
추천 모델llama-3.3-70b-versatile (무료), gemma2-9b-it (무료)

🧠 Anthropic Claude — 최고 품질의 추론과 글쓰기

Claude API는 긴 문서 분석, 코드 리뷰, 고품질 글쓰기 작업에서 GPT-4o와 함께 가장 높은 평가를 받습니다. Open WebUI v0.5 이상에서는 Anthropic API 전용 연결 입력란이 분리되어 있어 더 안정적으로 연동됩니다.

항목
Base URLhttps://api.anthropic.com/v1
API Key 발급console.anthropic.com
추천 모델claude-sonnet-4-6 (성능/비용 균형), claude-opus-4-6 (최고 성능)

🔮 Google Gemini — 무료 티어 + 멀티모달

항목
Base URLhttps://generativelanguage.googleapis.com/v1beta/openai/
API Key 발급aistudio.google.com (무료)
추천 모델gemini-2.0-flash (무료·빠름), gemini-2.5-pro (최고 성능)
✅ 목적별 모델 선택 실전 가이드
  • 일상 채팅 · 빠른 답변 — Groq llama-3.3-70b (무료, 초고속)
  • 긴 문서 분석 · 정밀한 글쓰기 — Claude claude-sonnet-4-6
  • 코딩 · 수학 · 추론 — OpenAI o3-mini 또는 Ollama deepseek-r1:8b
  • 이미지 분석 — OpenAI gpt-4o 또는 Claude claude-sonnet-4-6
  • 비용 0원으로 운영 — Groq + OpenRouter 무료 모델 조합
  • 완전한 프라이버시 — Ollama 로컬 모델 단독 운영
모델 연결 완료! 이제 본격적으로 시작하세요

채팅창 상단 모델 선택기에서 Ollama 로컬 모델과 GPT, Claude, Gemini, Groq를 자유롭게 전환하며 사용할 수 있습니다.

Leave a reply

Please enter your comment!
Please enter your name here