Agentic 운영 체계
AI 에이전트를 "개발자"가 아니라 "제품·GTM 팀"으로 쓰는 방법
Agentic MVP에서 Claude Code는 중심 도구지만, 운영 목표는 "코드를 많이 쓰기"가 아닙니다. 목표는 제품 신호를 더 빨리 만들고, 더 빨리 읽고, 더 빨리 판정하는 운영 체계입니다.
역할 분리: 제품팀을 작게 복제한다
하나의 세션에 모든 일을 시키면 컨텍스트가 비싸지고 판단이 흐려집니다. Agentic MVP는 역할을 분리해 작은 산출물을 빠르게 합칩니다.
| 역할 | 책임 | 산출물 |
|---|---|---|
| Discovery Scout | 타겟, 문제, 대안, 인터뷰 정리 | 반론 클러스터, 인터뷰 질문, 문제 지도 |
| GTM Analyst | 메시지, 채널, 가격, ICP | 랜딩 카피, DM/메일 템플릿, 가격 실험안 |
| Experiment Builder | Thin Slice, Fake Door, WoZ 구현 | 작은 PR, 실험 페이지, 이벤트 추가 |
| Analytics Translator | 로그를 의사결정 언어로 번역 | 퍼널 병목, 신호 품질, 다음 실험 후보 |
| Risk Reviewer | PII, 권한, 신뢰, 롤백 | 위험 체크리스트, 승인 지점, 릴리스 게이트 |
| Human Owner | 최종 가설, 범위, 판정, 윤리 책임 | Go/Pivot/Kill, 범위 축소, 고객 접촉 |
현실적인 운영
혼자 일해도 역할을 나누세요. 사람이 Human Owner와 최종 PM 역할을 맡고, 에이전트는 초안·정리·검증을 맡는 구조가 가장 안정적입니다.
도구 레이어: Claude Code만으로 끝내지 않는다
2026년의 변화는 단일 코딩 도구가 아니라 에이전트가 도구와 서로 연결되는 방식입니다.
| 레이어 | 쓰는 곳 | MVP에서의 의미 |
|---|---|---|
| Claude Code / Codex | 로컬 코드, 문서, 테스트, PR | 실험 구현과 반복 검증 |
| MCP | DB, GitHub, Slack, CRM, 문서 연결 | 커스텀 API 래퍼보다 빠른 도구·데이터 연결 |
| A2A | 에이전트 간 상태/작업 전달 | 여러 에이전트가 같은 사용자 과업을 이어받는 흐름 |
| Agents SDK류 런타임 | 앱 내부 specialist와 guardrail | 사용자-facing 에이전트 제품을 만들 때의 구조 |
| Browser automation | 랜딩/온보딩/결제 플로우 확인 | 실제 사용자가 보는 흐름 검증 |
OpenAI Agents SDK 문서의 실무 기준은 Agentic MVP에도 그대로 적용됩니다. 한 specialist가 직접 도구를 써야 하면 도구를 agent에 붙이고, manager가 사용자 응답을 통제해야 하면 specialist를 tool로 노출합니다. 권한이 걸린 행동은 guardrail과 human review를 통과하게 둡니다.
작업 단위: 30~90분 티켓
큰 요청은 성공률을 낮춥니다. 티켓은 "한 사용자 행동" 또는 "한 실험 신호"에 맞춥니다.
## 목표
- 사용자가 무엇을 할 수 있어야 하나?
- 어떤 신호를 수집해야 하나?
## 범위
- 포함:
- 제외:
## 수용 기준(AC)
- [ ] 사용자 여정 1개가 끝까지 통과한다
- [ ] 이벤트가 남는다
- [ ] 실패 상태가 보인다
## 제약
- PII 로그 금지
- 외부 발송/결제/삭제는 사람 승인
## 검증 방법
- [ ] 로컬 실행:
- [ ] 브라우저 경로:
- [ ] 이벤트 확인:리스크-퍼스트 개발
"큰 구현" 전에 실패 가능성이 높은 부분부터 공격합니다.
Spec-Driven Development: 프롬프트보다 판정 기준
에이전트에게 "알아서 MVP 만들어줘"라고 하면 산출물은 빨라도 학습은 느립니다. 먼저 스펙을 고정하세요.
바이브코딩의 함정
바이브코딩은 데모에는 빠르지만, MVP에서는 판정 기준과 계측이 빠지기 쉽습니다. 가설, AC, 이벤트, 실패 모드, 중단 기준을 먼저 텍스트로 고정해야 합니다.
에이전트 권한 설계
Agentic MVP에서 권한은 속도를 막는 장치가 아니라 사고를 막는 인터페이스입니다.
| 행동 유형 | 기본 정책 | 예시 |
|---|---|---|
| 읽기/요약 | 자동 허용 가능 | 문서 읽기, 로그 요약, 인터뷰 클러스터 |
| 코드 편집 | 작은 범위 허용 | 테스트 추가, 실험 페이지 수정 |
| 외부 발송 | 사람 승인 | 고객 메일, Slack 공지, 광고 업로드 |
| 데이터 변경 | 사람 승인 | DB 마이그레이션, 대량 업데이트 |
| 결제/삭제/배포 | 수동 승인 필수 | 가격 변경, 고객 데이터 삭제, 프로덕션 배포 |
Claude Code Hooks, Codex hooks/config, CI 정책, MCP allowlist를 같은 정책 언어로 맞추면 권한 피로를 줄일 수 있습니다. "매번 묻기"보다 어떤 행동은 자동, 어떤 행동은 승인, 어떤 행동은 금지인지 먼저 정하세요.
모델과 에이전트 선택 가이드
모델 이름과 가격은 자주 바뀌므로, MVP 문서에는 고정 숫자보다 작업 성격을 남깁니다.
| 작업 성격 | 추천 선택 |
|---|---|
| 카피 변형, 요약, 분류 | 빠른/저비용 모델 |
| UI 구현, 테스트, 리팩터 | 표준 코딩 모델 |
| 아키텍처, 복잡한 디버깅 | 깊은 추론 모델 |
| 보안/정책 검토 | 독립 리뷰 에이전트 + 사람 승인 |
잘 먹히는 작업 지시 패턴
아래 인터뷰 메모를 문제, 대안, 구매 트리거, 반론, 반복 표현으로 클러스터링해줘.
AI가 추론한 내용과 원문에서 직접 나온 내용을 분리해서 표시해줘.ICP 1개를 기준으로 랜딩 헤드라인 5안, 콜드메일 3안, 가격 반론 FAQ를 작성해줘.
각 안마다 어떤 가설을 검증하는지도 써줘.이 실험을 60분 단위 티켓으로 쪼개줘.
각 티켓은 사용자 행동, 이벤트, 실패 상태, 검증 방법을 포함해야 해.이벤트 로그와 인터뷰 요약을 기준으로 Go/Pivot/Kill 근거를 작성해줘.
정량 신호와 정성 신호를 분리하고, 증거가 약한 부분을 표시해줘.이 MVP에서 에이전트가 호출하는 도구를 읽기/쓰기/외부전송/삭제로 분류하고,
사람 승인이 필요한 지점을 표로 정리해줘.참고 자료
- Anthropic, 2026 Agentic Coding Trends Report — 역할 분리, 멀티 에이전트, 장기 실행 에이전트 운영 흐름.
- Anthropic, Effective Harnesses for Long-Running Agents — 진행 파일, 초기화 에이전트, 장기 작업 유지 전략.
- OpenAI, Using tools in the Agents SDK — specialist agent, tool wiring, guardrails, MCP 연결 기준.
- Google, A developer's guide to AI agent protocols — MCP, A2A 등 에이전트 프로토콜의 역할 구분.
- Marty Cagan, Inspired — Product Discovery와 Delivery를 분리해 제품 리스크를 먼저 줄이는 원칙.