오픈소스 BaaS Dify 가이드: 플랫폼 개념 및 시스템 아키텍처 분석 (1/5)

Dify AI Platform Self-hosted Architecture LLM RAG
Dify는 LLM 기반 AI 애플리케이션을 코딩 없이 빠르게 만들 수 있는 오픈소스 플랫폼입니다. 단순한 챗봇부터 복잡한 RAG 파이프라인, 멀티 에이전트 워크플로우까지 — GUI 기반으로 구성하고, 셀프호스팅으로 데이터를 완전히 통제할 수 있습니다. 이 가이드를 통해 완전히 격리된 홈랩 인프라에 나만의 AI 엔진을 이식해 보세요.
Dify 완전 정복 시리즈 로드맵
1
Dify 정의 및 활용 한계 체크
2
시스템 아키텍처 및 내부 컨테이너 분석
3
호스트 인프라 및 하드웨어 사양 검증
4
네 가지 핵심 애플리케이션 유형 분석
STEP01

Dify란 무엇인가

Dify(Do It For You)는 오픈소스 LLM 애플리케이션 개발 플랫폼입니다. GitHub 스타 90,000+를 돌파하며 셀프호스팅 AI 플랫폼 중 가장 활발하게 개발되는 대형 프로젝트입니다.

핵심 가치는 세 가지입니다. 첫째, 복잡한 AI 파이프라인을 코딩 없이 GUI로 구성합니다. 둘째, 단일 인터페이스로 100개 이상의 LLM 공급자를 통제합니다. 셋째, 완전한 셀프호스팅을 지원하여 핵심 데이터 유출을 원천 차단합니다.

Dify로 구축 가능한 핵심 기능

📂
RAG 기반 지식 챗봇 핵심 기능
PDF, 웹페이지, Notion 등을 파싱·인덱싱하여 정밀 문서 기반 Q&A 시스템 구현
주요 기술 스펙
벡터 검색과 BM25 하이브리드 검색을 기본 지원하며, 고도화된 컨텍스트 매칭을 제공합니다.
AI 워크플로우 자동화 시각적 구성
조건 분기, 반복, 격리 코드 실행을 포함한 정밀 파이프라인 제어
지원 노드 컴포넌트
IF/ELSE 분기 HTTP Request 코드 실행 샌드박스
🤖
멀티 모델 인프라 통합 관리 100+ 공급자
다양한 상용 LLM과 로컬 오픈소스 인프라 모델 통합 연동 및 스위칭
연동 예시
OpenAI GPT-4o, Anthropic Claude 및 로컬 인프라의 Ollama 가상엔진 완벽 호환

오픈소스 AI 플랫폼 지표 비교

플랫폼코딩 필요셀프호스팅RAG 지원워크플로우멀티 모델
Dify불필요완전 지원고급지원100+
LangChain필요지원고급코드 제어다수
Flowise불필요지원기본형지원제한적
n8n + AI일부 필요지원제한적강력제한적
💡
엔지니어가 셀프호스팅을 선택해야 하는 이유

Cloud 환경은 호출 세션 및 트래픽 제한과 민감 내부 데이터 유출 리스크가 따릅니다. 인하우스 홈랩을 통한 독자 인프라 배포는 초기 구성 이후 무제한 호출 트래픽 보장, 철저한 내부망 격리, 로컬 LLM 클러스터 직결 연동이라는 대체 불가능한 고유 이점을 가집니다.

STEP02

Dify 시스템 아키텍처 완전 이해

Dify는 Docker Compose 오케스트레이션을 기반으로 다수의 마이크로서비스 컨테이너가 유기적으로 연동되어 작동합니다. 아키텍처 계층을 이해해야 트러블슈팅 발생 시 정확한 타깃 로그 파싱이 가능해집니다.

컨테이너 명칭기능 개요 및 역할표준 포트진단 포인트
dify-nginx모든 네트워크 인바운드 트래픽을 라우팅하는 리버스 프록시 진입점80 / 443웹 세션 접속 거부 발생 시
dify-webNext.js 기반의 프론트엔드 관리 웹 콘솔 대시보드3000UI 컴포넌트 렌더링 에러 발생 시
dify-apiFastAPI 기반의 코어 백엔드 API 서버 (비즈니스 로직 제어)5001인증 오류 및 API 호출 실패 시
dify-workerCelery 비동기 엔진 (문서 인덱싱, 청크 분할, 백그라운드 태스크)지식베이스 빌드 지연 발생 시
dify-dbPostgreSQL 인프라 데이터 레이어 (계정 및 히스토리 저장)5432데이터 무결성 에러 발생 시
dify-qdrant고속 벡터 DB 계층 (임베딩 벡터 스토리지 및 유사도 매칭)6333RAG 지식 검색 정밀도 유실 시
dify-sandbox격리된 코드 실행 가상 환경 (보안 자바스크립트/파이썬 실행 엔진)8194코드 노드 스크립트 실행 실패 시

트래픽 요청 및 비동기 파이프라인 흐름

Browser / Client Nginx (80/443) dify-api (FastAPI)
동기 쿼리 즉시 응답 반환
비동기 인덱싱 dify-redis (Broker) dify-worker (Celery)
임베딩 연산 Ollama Engine dify-qdrant (Vector)
⚠️
CRITICAL: 영구 볼륨 레이어 보호 조치 규칙

Dify 오케스트레이션 내의 모든 휘발성 영구 데이터는 호스트의 docker/volumes/ 디렉토리에 마운트됩니다. 데이터베이스 스키마와 물리 세션이 가동 중인 환경에서 컨테이너 검증 없이 빌드를 강제하거나, 마이그레이션 도중 해당 컨텍스트가 임의로 손상될 경우 DB 초기화로 인한 심각한 데이터 유실이 발생하므로 백업 정책 수립 전 절대 해당 볼륨 컨텍스트를 수정하지 마십시오.

STEP03

인프라 하드웨어 요구사항 검증

호스트 인프라 표준 요구 사양 표

인프라 항목최소 가동 사양 (개발·테스트용)권장 운영 사양 (실전 빌드용)
물리 코어 수 (CPU)2 Cores4 Cores 이상 권장
시스템 메모리 (RAM)4 GB8 GB 이상 메인 메모리
스토리지 디스크 크기20 GB 여유 공간50 GB 이상 고속 가속 NVMe/SSD
인프라 구동 OS 환경Ubuntu 20.04 LTS / Rocky Linux 8Ubuntu 22.04+ / Rocky Linux 9 표준 호환
Docker Engine24.0+ 정식 릴리즈 버전최신 Stable 가동 환경

Ollama 로컬 가속 구동 시 추가 자원 할당 명세

가속 모델 크기예시 모델 컨텍스트최소 시스템 RAM 추가가속 VRAM 스펙 (권장)
7B Classqwen2.5:7b, llama3.1:8b+ 8 GB 이상5 GB+ 할당
12~14B Classqwen2.5:14b, mistral-nemo:12b+ 16 GB 이상9 GB+ 고속 VRAM
Embedding Layerbge-m3, nomic-embed-text+ 2 GB 최소1.5 GB 가속 스토리지
STEP04

Dify 애플리케이션 유형 분석

Dify 프레임워크는 배포 목적에 맞춤화된 네 가지 비즈니스 앱 유형을 구조화하여 제공합니다.

앱 아키텍처 모델동작 메커니즘 특성추천 사용 타깃사례구현 난이도 배배지
Chatbot단순 턴제 대화형. 프롬프트 세팅 및 지식 연동 위주사내 표준 FAQ 및 상시 고객 응답 인프라Low
Agent툴 가동 자율 추론. 외부 검색 API 및 샌드박스 추론 연동자동 데이터 분석 파이프라인 및 리서치 팩트 체크Medium
Workflow완전 비대화형 자동화 파이프라인 정밀 노드 스트림대량 문서 일괄 전처리, 데이터 배치 트랜잭션Medium
Chat FlowWorkflow 제어와 대화 인터페이스의 복합 통합 모듈정밀 엔지니어링 조건 제어형 RAG 시스템High
이전 글 시리즈의 첫 번째 포스팅입니다.
다음 글 Docker Compose 설치 가이드 — OS별 패키지 빌드 및 방화벽 완벽 보안

Leave a reply

Please enter your comment!
Please enter your name here