Agentic 운영 체계

AI 에이전트를 개발 보조가 아닌 제품·GTM 실험팀으로 운영하는 체계. 역할 분리, 도구 레이어, 30~90분 티켓, 권한 설계로 제품 신호를 더 빨리 만드는 방법을 다룹니다.

핵심 요약

Agentic MVP의 운영 목표는 코드를 많이 쓰는 것이 아니라 제품 신호를 더 빨리 만들고 읽고 판정하는 것입니다.
Discovery·GTM·Build·Analytics·Risk 5개 에이전트 역할로 제품팀을 작게 복제하고, 사람은 Human Owner로 최종 판정을 맡습니다.
Claude Code·MCP·A2A·Agents SDK·브라우저 자동화 도구 레이어를 조합하고, 작업은 30~90분 티켓으로 쪼갭니다.
코드 구현 전에 시장·경험·기술·운영 리스크 순으로 공격하는 리스크-퍼스트와 Spec 고정을 적용합니다.
행동을 읽기·코드편집·외부발송·데이터변경·결제/삭제로 나눠 자동 허용·사람 승인·금지를 미리 정합니다.

Agentic MVP에서 Claude Code는 중심 도구지만, 운영 목표가 "코드를 많이 쓰기"는 아닙니다. 목표는 제품 신호를 더 빨리 만들고, 더 빨리 읽고, 더 빨리 판정하는 운영 체계입니다.

Discovery, GTM, Experiment Build, Analytics, Risk Review 에이전트가 사람의 의사결정 콘솔에 연결된 운영 체계

역할 분리: 제품팀을 작게 복제한다

한 세션에 모든 일을 몰아주면 컨텍스트 비용이 커지고 판단이 흐려집니다. Agentic MVP는 역할을 나눠 작은 산출물을 빠르게 합칩니다.

역할	책임	산출물
Discovery Scout	타겟, 문제, 대안, 인터뷰 정리	반론 클러스터, 인터뷰 질문, 문제 지도
GTM Analyst	메시지, 채널, 가격, ICP	랜딩 카피, DM/메일 템플릿, 가격 실험안
Experiment Builder	Thin Slice, Fake Door, WoZ 구현	작은 PR, 실험 페이지, 이벤트 추가
Analytics Translator	로그를 의사결정 언어로 번역	퍼널 병목, 신호 품질, 다음 실험 후보
Risk Reviewer	PII, 권한, 신뢰, 롤백	위험 체크리스트, 승인 지점, 릴리스 게이트
Human Owner	최종 가설, 범위, 판정, 윤리 책임	Go/Pivot/Kill, 범위 축소, 고객 접촉

현실적인 운영

혼자 일해도 역할은 나누세요. 사람이 Human Owner와 최종 PM을 맡고, 에이전트는 초안·정리·검증을 맡는 구조가 가장 안정적입니다.

도구 레이어: Claude Code만으로 끝내지 않는다

2026년에 달라진 건 단일 코딩 도구가 아니라 에이전트가 도구와 서로 연결되는 방식입니다.

레이어	쓰는 곳	MVP에서의 의미
Claude Code / Codex	로컬 코드, 문서, 테스트, PR	실험 구현과 반복 검증
MCP	DB, GitHub, Slack, CRM, 문서 연결	커스텀 API 래퍼보다 빠른 도구·데이터 연결
A2A	에이전트 간 상태/작업 전달	여러 에이전트가 같은 사용자 과업을 이어받는 흐름
Agents SDK류 런타임	앱 내부 specialist와 guardrail	사용자-facing 에이전트 제품을 만들 때의 구조
Browser automation	랜딩/온보딩/결제 플로우 확인	실제 사용자가 보는 흐름 검증

OpenAI Agents SDK 문서의 실무 기준은 Agentic MVP에도 그대로 통합니다. 한 specialist가 직접 도구를 써야 하면 도구를 agent에 붙이고, manager가 사용자 응답을 통제해야 하면 specialist를 tool로 노출합니다. 권한이 걸린 행동은 guardrail과 human review를 거치게 둡니다.

작업 단위: 30~90분 티켓

요청이 크면 성공률이 떨어집니다. 티켓은 "한 사용자 행동" 또는 "한 실험 신호"에 맞춥니다.

## 목표

- 사용자가 무엇을 할 수 있어야 하나?
- 어떤 신호를 수집해야 하나?

## 범위

- 포함:
- 제외:

## 수용 기준(AC)

- [ ] 사용자 여정 1개가 끝까지 통과한다
- [ ] 이벤트가 남는다
- [ ] 실패 상태가 보인다

## 제약

- PII 로그 금지
- 외부 발송/결제/삭제는 사람 승인

## 검증 방법

- [ ] 로컬 실행:
- [ ] 브라우저 경로:
- [ ] 이벤트 확인:

리스크-퍼스트 개발

"큰 구현" 전에 실패 가능성이 높은 부분부터 공격합니다.

### 시장 리스크 메시지, 타겟, 가격, 신뢰 반론이 먼저 맞는지 확인합니다.

### 경험 리스크 온보딩, 입력 준비, 결과 품질, 대기 시간을 작은 화면으로 검증합니다.

### 기술 리스크 외부 API, 데이터 권한, LLM 비용, 응답 지연을 단일 기능으로 먼저 확인합니다.

### 운영 리스크 사람이 수동으로 처리할 때의 SLA, 예외, 고객 고지를 먼저 정의합니다.

Spec-Driven Development: 프롬프트보다 판정 기준

에이전트에게 "알아서 MVP 만들어줘"라고 하면 산출물은 빨리 나와도 배우는 속도는 느립니다. 먼저 스펙을 고정하세요.

바이브코딩의 함정

바이브코딩은 데모는 빨리 뽑지만, MVP에서는 판정 기준과 계측이 빠지기 쉽습니다. 가설, AC, 이벤트, 실패 모드, 중단 기준을 먼저 텍스트로 박아두세요.

### Plan 먼저 코드 수정 없이 가설, 범위, 리스크, 티켓 순서를 분석합니다.

### Spec 고정 AC, 이벤트, 실패 모드, 제외 범위를 문서화합니다.

### Build 작게 사용자 여정 하나 또는 신호 하나만 구현합니다.

### Verify 브라우저, 테스트, 이벤트 로그, 사용자 반응을 함께 확인합니다.

에이전트 권한 설계

Agentic MVP에서 권한은 속도를 막는 장치가 아니라 사고를 막는 인터페이스입니다.

행동 유형	기본 정책	예시
읽기/요약	자동 허용 가능	문서 읽기, 로그 요약, 인터뷰 클러스터
코드 편집	작은 범위 허용	테스트 추가, 실험 페이지 수정
외부 발송	사람 승인	고객 메일, Slack 공지, 광고 업로드
데이터 변경	사람 승인	DB 마이그레이션, 대량 업데이트
결제/삭제/배포	수동 승인 필수	가격 변경, 고객 데이터 삭제, 프로덕션 배포

Claude Code Hooks, Codex hooks/config, CI 정책, MCP allowlist를 같은 정책 언어로 맞추면 권한 피로가 줄어듭니다. "매번 묻기"보다 어떤 행동은 자동, 어떤 행동은 승인, 어떤 행동은 금지인지 먼저 정하세요.

모델과 에이전트 선택 가이드

모델 이름과 가격은 자주 바뀌니, MVP 문서에는 고정 숫자보다 작업 성격을 남깁니다.

작업 성격	추천 선택
카피 변형, 요약, 분류	빠른/저비용 모델
UI 구현, 테스트, 리팩터	표준 코딩 모델
아키텍처, 복잡한 디버깅	깊은 추론 모델
보안/정책 검토	독립 리뷰 에이전트 + 사람 승인

잘 먹히는 작업 지시 패턴

아래 인터뷰 메모를 문제, 대안, 구매 트리거, 반론, 반복 표현으로 클러스터링해줘.
AI가 추론한 내용과 원문에서 직접 나온 내용을 분리해서 표시해줘.

ICP 1개를 기준으로 랜딩 헤드라인 5안, 콜드메일 3안, 가격 반론 FAQ를 작성해줘.
각 안마다 어떤 가설을 검증하는지도 써줘.

이 실험을 60분 단위 티켓으로 쪼개줘.
각 티켓은 사용자 행동, 이벤트, 실패 상태, 검증 방법을 포함해야 해.

이벤트 로그와 인터뷰 요약을 기준으로 Go/Pivot/Kill 근거를 작성해줘.
정량 신호와 정성 신호를 분리하고, 증거가 약한 부분을 표시해줘.

이 MVP에서 에이전트가 호출하는 도구를 읽기/쓰기/외부전송/삭제로 분류하고,
사람 승인이 필요한 지점을 표로 정리해줘.

참고 자료

Anthropic, 2026 Agentic Coding Trends Report — 역할 분리, 멀티 에이전트, 장기 실행 에이전트 운영 흐름.
Anthropic, Effective Harnesses for Long-Running Agents — 진행 파일, 초기화 에이전트, 장기 작업 유지 전략.
OpenAI, Using tools in the Agents SDK — specialist agent, tool wiring, guardrails, MCP 연결 기준.
Google, A developer's guide to AI agent protocols — MCP, A2A 등 에이전트 프로토콜의 역할 구분.
Marty Cagan, Inspired — Product Discovery와 Delivery를 분리해 제품 리스크를 먼저 줄이는 원칙.

핵심 요약

Agentic MVP의 운영 목표는 코드를 많이 쓰는 것이 아니라 제품 신호를 더 빨리 만들고 읽고 판정하는 것입니다.
Discovery·GTM·Build·Analytics·Risk 5개 에이전트 역할로 제품팀을 작게 복제하고, 사람은 Human Owner로 최종 판정을 맡습니다.
Claude Code·MCP·A2A·Agents SDK·브라우저 자동화 도구 레이어를 조합하고, 작업은 30~90분 티켓으로 쪼갭니다.
코드 구현 전에 시장·경험·기술·운영 리스크 순으로 공격하는 리스크-퍼스트와 Spec 고정을 적용합니다.
행동을 읽기·코드편집·외부발송·데이터변경·결제/삭제로 나눠 자동 허용·사람 승인·금지를 미리 정합니다.

역할 분리: 제품팀을 작게 복제한다

한 세션에 모든 일을 몰아주면 컨텍스트 비용이 커지고 판단이 흐려집니다. Agentic MVP는 역할을 나눠 작은 산출물을 빠르게 합칩니다.

역할	책임	산출물
Discovery Scout	타겟, 문제, 대안, 인터뷰 정리	반론 클러스터, 인터뷰 질문, 문제 지도
GTM Analyst	메시지, 채널, 가격, ICP	랜딩 카피, DM/메일 템플릿, 가격 실험안
Experiment Builder	Thin Slice, Fake Door, WoZ 구현	작은 PR, 실험 페이지, 이벤트 추가
Analytics Translator	로그를 의사결정 언어로 번역	퍼널 병목, 신호 품질, 다음 실험 후보
Risk Reviewer	PII, 권한, 신뢰, 롤백	위험 체크리스트, 승인 지점, 릴리스 게이트
Human Owner	최종 가설, 범위, 판정, 윤리 책임	Go/Pivot/Kill, 범위 축소, 고객 접촉

현실적인 운영

혼자 일해도 역할은 나누세요. 사람이 Human Owner와 최종 PM을 맡고, 에이전트는 초안·정리·검증을 맡는 구조가 가장 안정적입니다.

도구 레이어: Claude Code만으로 끝내지 않는다

2026년에 달라진 건 단일 코딩 도구가 아니라 에이전트가 도구와 서로 연결되는 방식입니다.

레이어	쓰는 곳	MVP에서의 의미
Claude Code / Codex	로컬 코드, 문서, 테스트, PR	실험 구현과 반복 검증
MCP	DB, GitHub, Slack, CRM, 문서 연결	커스텀 API 래퍼보다 빠른 도구·데이터 연결
A2A	에이전트 간 상태/작업 전달	여러 에이전트가 같은 사용자 과업을 이어받는 흐름
Agents SDK류 런타임	앱 내부 specialist와 guardrail	사용자-facing 에이전트 제품을 만들 때의 구조
Browser automation	랜딩/온보딩/결제 플로우 확인	실제 사용자가 보는 흐름 검증

작업 단위: 30~90분 티켓

요청이 크면 성공률이 떨어집니다. 티켓은 "한 사용자 행동" 또는 "한 실험 신호"에 맞춥니다.

## 목표

- 사용자가 무엇을 할 수 있어야 하나?
- 어떤 신호를 수집해야 하나?

## 범위

- 포함:
- 제외:

## 수용 기준(AC)

- [ ] 사용자 여정 1개가 끝까지 통과한다
- [ ] 이벤트가 남는다
- [ ] 실패 상태가 보인다

## 제약

- PII 로그 금지
- 외부 발송/결제/삭제는 사람 승인

## 검증 방법

- [ ] 로컬 실행:
- [ ] 브라우저 경로:
- [ ] 이벤트 확인:

리스크-퍼스트 개발

"큰 구현" 전에 실패 가능성이 높은 부분부터 공격합니다.

### 시장 리스크 메시지, 타겟, 가격, 신뢰 반론이 먼저 맞는지 확인합니다.

### 경험 리스크 온보딩, 입력 준비, 결과 품질, 대기 시간을 작은 화면으로 검증합니다.

### 기술 리스크 외부 API, 데이터 권한, LLM 비용, 응답 지연을 단일 기능으로 먼저 확인합니다.

### 운영 리스크 사람이 수동으로 처리할 때의 SLA, 예외, 고객 고지를 먼저 정의합니다.

Spec-Driven Development: 프롬프트보다 판정 기준

에이전트에게 "알아서 MVP 만들어줘"라고 하면 산출물은 빨리 나와도 배우는 속도는 느립니다. 먼저 스펙을 고정하세요.

바이브코딩의 함정

### Plan 먼저 코드 수정 없이 가설, 범위, 리스크, 티켓 순서를 분석합니다.

### Spec 고정 AC, 이벤트, 실패 모드, 제외 범위를 문서화합니다.

### Build 작게 사용자 여정 하나 또는 신호 하나만 구현합니다.

### Verify 브라우저, 테스트, 이벤트 로그, 사용자 반응을 함께 확인합니다.

에이전트 권한 설계

Agentic MVP에서 권한은 속도를 막는 장치가 아니라 사고를 막는 인터페이스입니다.

행동 유형	기본 정책	예시
읽기/요약	자동 허용 가능	문서 읽기, 로그 요약, 인터뷰 클러스터
코드 편집	작은 범위 허용	테스트 추가, 실험 페이지 수정
외부 발송	사람 승인	고객 메일, Slack 공지, 광고 업로드
데이터 변경	사람 승인	DB 마이그레이션, 대량 업데이트
결제/삭제/배포	수동 승인 필수	가격 변경, 고객 데이터 삭제, 프로덕션 배포

모델과 에이전트 선택 가이드

모델 이름과 가격은 자주 바뀌니, MVP 문서에는 고정 숫자보다 작업 성격을 남깁니다.

작업 성격	추천 선택
카피 변형, 요약, 분류	빠른/저비용 모델
UI 구현, 테스트, 리팩터	표준 코딩 모델
아키텍처, 복잡한 디버깅	깊은 추론 모델
보안/정책 검토	독립 리뷰 에이전트 + 사람 승인

잘 먹히는 작업 지시 패턴

아래 인터뷰 메모를 문제, 대안, 구매 트리거, 반론, 반복 표현으로 클러스터링해줘.
AI가 추론한 내용과 원문에서 직접 나온 내용을 분리해서 표시해줘.

ICP 1개를 기준으로 랜딩 헤드라인 5안, 콜드메일 3안, 가격 반론 FAQ를 작성해줘.
각 안마다 어떤 가설을 검증하는지도 써줘.

이 실험을 60분 단위 티켓으로 쪼개줘.
각 티켓은 사용자 행동, 이벤트, 실패 상태, 검증 방법을 포함해야 해.

이벤트 로그와 인터뷰 요약을 기준으로 Go/Pivot/Kill 근거를 작성해줘.
정량 신호와 정성 신호를 분리하고, 증거가 약한 부분을 표시해줘.

이 MVP에서 에이전트가 호출하는 도구를 읽기/쓰기/외부전송/삭제로 분류하고,
사람 승인이 필요한 지점을 표로 정리해줘.

참고 자료

Anthropic, 2026 Agentic Coding Trends Report — 역할 분리, 멀티 에이전트, 장기 실행 에이전트 운영 흐름.
Anthropic, Effective Harnesses for Long-Running Agents — 진행 파일, 초기화 에이전트, 장기 작업 유지 전략.
OpenAI, Using tools in the Agents SDK — specialist agent, tool wiring, guardrails, MCP 연결 기준.
Google, A developer's guide to AI agent protocols — MCP, A2A 등 에이전트 프로토콜의 역할 구분.
Marty Cagan, Inspired — Product Discovery와 Delivery를 분리해 제품 리스크를 먼저 줄이는 원칙.

역할 분리: 제품팀을 작게 복제한다

도구 레이어: Claude Code만으로 끝내지 않는다

작업 단위: 30~90분 티켓

리스크-퍼스트 개발

Spec-Driven Development: 프롬프트보다 판정 기준

에이전트 권한 설계

모델과 에이전트 선택 가이드

잘 먹히는 작업 지시 패턴

참고 자료

목차

Agentic 운영 체계

역할 분리: 제품팀을 작게 복제한다

도구 레이어: Claude Code만으로 끝내지 않는다

작업 단위: 30~90분 티켓

리스크-퍼스트 개발

Spec-Driven Development: 프롬프트보다 판정 기준

에이전트 권한 설계

모델과 에이전트 선택 가이드

잘 먹히는 작업 지시 패턴

참고 자료

목차