Vercel 엔터프라이즈 AI 플랫폼
AI SDK, AI Gateway, Workflow, Sandbox, Queues를 중심으로 엔터프라이즈급 AI 제품을 설계·운영하는 완전판 가이드
엔터프라이즈 AI는 모델을 붙이는 작업이 아니라 제어면(Control Plane)과 실행면(Runtime Plane)을 분리하는 플랫폼 설계 문제입니다. Vercel의 AI Cloud는 이 둘을 한 제품으로 감추기보다, 애플리케이션 표준화(AI SDK), 모델 제어(AI Gateway), 장기 실행(Workflow), 격리 실행(Sandbox), 비동기 분산(Queues) 을 조합할 수 있게 제공한다는 점이 핵심입니다.
대상 독자
이 책은 플랫폼 엔지니어, AI 인프라 리드, Staff+ Engineer를 1차 독자로 둡니다. 기본 API 사용법보다 서비스 경계, 운영 표준, 비용 통제, 승인 흐름, 감사 가능성에 집중합니다.
기준선
- 이 책의 제품/문서 기준선은 2026년 5월 4일입니다.
- 본문의 핵심 주장은 AI SDK Docs, Vercel Docs, Vercel Blog 기준으로 정리했습니다.
- X 신호는 본문 보조 근거로만 사용하고, 주된 기술 판단은 공식 문서와 공식 블로그에 묶습니다.
플랫폼 운영식
| 계층 | 기본 책임 | 대표 서비스 | 실패 시 영향 |
|---|---|---|---|
| Experience Plane | 사용자 요청 수집, 권한 문맥 주입, UI 스트리밍 | Next.js, AI SDK UI | UX 저하, 부분 기능 장애 |
| Control Plane | 모델 선택, 라우팅, 비용/정책 중앙화 | AI Gateway | 전 모델 호출 정책 붕괴 |
| Agent Plane | 장기 작업, 이벤트 재개, 승인 오케스트레이션 | Workflow | 백그라운드 작업 정체 |
| Tool Runtime Plane | 코드/파일/쉘 실행, 격리 | Sandbox | 데이터 유출, lateral movement |
| Async Plane | 비동기 분산, 배치 처리, 속도 조절 | Queues | 파이프라인 정체 |
| Governance Plane | 관측성, 보안, 감사 추적 | Observability, WAF, BotID, OIDC | 사고 탐지 불가 |
성숙도 모델
| 레벨 | 상태 | 특징 | 다음 단계 조건 |
|---|---|---|---|
| L1 Prototype | 기능 데모 | 단일 모델, 단일 프롬프트, 수동 운영 | 호출 로그 표준화 |
| L2 Controlled | 통제 시작 | Gateway 도입, API key 분리, 승인 포인트 명시 | Workflow 기반 장기 실행 분리 |
| L3 Reliable | 운영 안정화 | 재시도, fallback, sandbox 격리, tracing | 비용/품질 대시보드 고정 |
| L4 Governed | 감사 가능한 플랫폼 | 프로젝트/팀/키 단위 책임 추적, ZDR/BYOK 정책화 | 분기별 아키텍처 재검토 |
전체 아키텍처
책 구성
Part 1. 플랫폼 기초
Ch1. 플랫폼 아키텍처
앱, 제어면, 실행면, 공통 거버넌스 계층을 어디에서 분리해야 하는지 정리합니다.
Ch2. AI SDK 런타임
Agent, tool, MCP, telemetry를 애플리케이션 계층 표준으로 묶는 법을 설명합니다.
Ch3. AI Gateway 제어면
모델 라우팅, fallback, BYOK, ZDR, usage governance를 중앙화하는 법을 다룹니다.
Part 2. 실행 런타임
Ch4. Workflow 장기 실행
장시간 작업, 이벤트 재개, 승인 플로우를 Workflow로 분리하는 기준을 제시합니다.
Ch5. Sandbox 실행 격리
코드 실행 에이전트의 공격면을 격리하고 피해 반경을 제한하는 설계를 정리합니다.
Ch6. MCP 데이터 계층
사내 시스템을 tools/resources/prompts로 분리해 연결하는 패턴을 설명합니다.
Ch7. Queues & 비동기 작업
fan-out, 배치 처리, 재시도·poison message 운영과 Workflow 조합 패턴을 다룹니다.
Part 3. 프롬프트 & 품질
Ch8. 프롬프트 엔지니어링 & 가드레일
엔터프라이즈 프롬프트 설계, 입출력 가드레일, 안전성 계층을 정리합니다.
Ch9. RAG & 검색 증강 생성
인덱싱 파이프라인, 쿼리 파이프라인, 리랭킹, 평가 기준을 설명합니다.
Ch10. 관측성·평가
Gateway, Workflow, App trace를 하나의 운영 루프로 묶는 방법을 다룹니다.
Part 4. 운영 체계
Ch11. 보안·거버넌스
OIDC, API key, ZDR, WAF, BotID, approval gate를 어떤 위치에 두어야 하는지 정리합니다.
Ch12. 비용·안정성
비용, 지연시간, 에러 버짓을 함께 관리하는 운영 기준을 제시합니다.
Ch13. 배포 전략 & AI CI/CD
Preview, canary, eval 파이프라인, kill-switch, 롤백 전략을 정리합니다.
Part 5. 실전 시나리오
Ch14. 고객지원 에이전트
MCP read-only resource, fast tier fallback, escalation을 포함한 고객-facing 지원 구조를 설명합니다.
Ch15. 내부 리서치 에이전트
Workflow, Sandbox, artifact를 중심으로 긴 분석 작업을 설계하는 방식을 정리합니다.
Ch16. 승인형 백오피스 자동화
approval event, operator identity, side effect 통제를 포함한 업무 자동화 패턴을 설명합니다.
Ch17. 코딩 오케스트레이션
repo-aware coding agent를 이슈 수집부터 테스트와 PR 초안까지 연결하는 운영 체계를 설명합니다.
Part 6. 오케스트레이션 패턴
Ch18. 그래프 중심 오케스트레이션
LangGraph식 graph/state 사고방식을 Vercel의 code-first runtime으로 매핑하는 방법을 설명합니다.
Ch19. 실무 오케스트레이션 플레이북
ticket triage, alert triage, approval queue, scheduled reporting을 runbook형 예제로 정리합니다.
Ch20. 멀티 에이전트 아키텍처
supervisor, pipeline, delegation 패턴과 AI SDK subagent 구현을 정리합니다.
부록
부록. 마이그레이션 가이드
LangChain, LangGraph, 커스텀 오케스트레이션에서의 전환 전략을 정리합니다.
부록. 레퍼런스
공식 문서, 블로그, 공개 X 신호를 계층별로 묶어 관리합니다.
부록. 검증 리포트
근거, 최신성, 추론 구간을 분리해 기록합니다.
부록. 업데이트 내역
핸드북 변경 이력과 반영 근거를 관리합니다.
핵심 원칙
- 애플리케이션 로직과 모델 정책을 분리합니다.
- 짧은 요청과 긴 작업을 분리합니다.
- 툴 실행은 항상 격리 런타임으로 분리합니다.
- 모든 호출은 프로젝트·API key·사용자 문맥 기준으로 추적합니다.
- Fallback은 품질 보장보다 운영 연속성 확보를 위한 장치로 취급합니다.
- 프롬프트는 코드 자산으로, 가드레일은 전 구간에 배치합니다.
연관 핸드북
- 운영 성숙도와 가드레일은 LLMOps·AgentOps 프로덕션을 함께 보세요.
- 보안 통제와 감사 관점은 AI 보안·컴플라이언스 운영을 함께 보세요.
- Vercel 기반 앱/모노레포 설계는 엔터프라이즈 프로젝트 설계을 참고하세요.