Ch12. 모델/추론 전략
GPT-5.5, GPT-5.4, GPT-5.4-mini, GPT-5.3-Codex-Spark 기준 운영 전략
핵심 요약
- 2026-06-12 기준
gpt-5.5가 most tasks 시작점이며 ChatGPT 로그인과 API-key 인증 모두에서 지원되고, 보수적 운영이 필요하면gpt-5.4를 fallback으로 명시합니다. - 보조 에이전트·반복 작업은
gpt-5.4-mini, latency 우선 짧은 반복은 Pro용 text-only research preview인gpt-5.3-codex-spark로 좁게 씁니다. gpt-5.5-codex·gpt-5.5-mini·gpt-5.5-nano는 공식 추천 목록에 없고,gpt-5.2·gpt-5.3-codex는 ChatGPT 경로에서 deprecated이므로/modelpicker로 재확인합니다.- 세션 중에는
/model·Alt+,로 모델과 reasoning effort를 조정하되, 0.138.0 이후 effort 목록은 고정 문자열이 아니라 picker가 광고한 순서를 따릅니다. /review용review_model을 별도로 두고, Cloud task의 기본 모델은 사용자가 바꿀 수 없으므로 로컬 모델 표준과 분리해 문서화합니다.
Codex는 작업 성격에 맞춰 모델/추론 수준을 조정합니다. 시니어 개발자라면 분석과 구현을 나눠서 비용 대비 품질을 끌어올리는 게 좋습니다.
현재 추천 모델 (2026-06-12 KST 기준)
| 모델 | 특성 | 추천 용도 |
|---|---|---|
| GPT-5.5 | Codex가 대부분의 작업에 기본 추천하는 최신 frontier model | 복잡한 코딩, browser use, computer use, 지식 작업, 리서치 |
| GPT-5.4 | GPT-5.3-Codex의 코딩 역량을 일반 reasoning/tool use와 합친 이전 flagship | 안정적 범용 코딩, 보수적 fallback, GPT-5.5 과부하/정책 예외 |
| GPT-5.4-mini | 빠르고 효율적인 mini model | 가벼운 코딩, 보조 에이전트, 비용 민감한 반복 작업 |
| GPT-5.3-Codex-Spark | Pro 사용자용 text-only research preview, 빠른 실시간 반복에 최적화 | 짧은 탐색, 빠른 iteration, latency 우선 작업 |
기준점 변경: GPT-5.5 중심
공식 Codex Models 문서 기준으로 gpt-5.5가 most tasks 시작점입니다. 2026-06-12 재검증 기준
gpt-5.5는 ChatGPT 로그인과 API-key 인증 모두에서 Codex CLI/SDK·App/IDE에 지원됩니다.
Codex cloud tasks의 기본 모델은 지금 사용자가 직접 바꿀 수 없으니, 로컬 CLI/SDK/App/IDE 모델 정책과
Cloud task 정책을 한 설정으로 묶지 마세요.
모델 이름 검증
2026-06-12 기준 공식 Codex Models 문서에는 gpt-5.5-codex, gpt-5.5-mini, gpt-5.5-nano가
추천 모델로 올라와 있지 않습니다. 과거 메모나 비공식 목록에서 본 이름이라면 팀 설정에 넣기 전에
/model picker와 공식 Models 페이지로 다시 확인하세요.
Deprecated Codex models
공식 Models 문서는 ChatGPT 로그인 경로의 gpt-5.2와 gpt-5.3-codex를 deprecated로 표시합니다.
기존 config, codex exec --model, runbook에 남아 있다면 추천 모델(gpt-5.5, gpt-5.4,
gpt-5.4-mini, gpt-5.3-codex-spark) 중 하나로 옮기세요. API 쪽 가용성은 API models
페이지에서 따로 확인합니다.
모델별 역할 분리
GPT-5.5
- 공식 문서는
GPT-5.5를 복잡한 coding, computer use, knowledge work, research workflow에 적합한 최신 모델로 설명합니다. - 프론트엔드 wide-context 탐색, 브라우저 검증, 도구를 섞어 쓰는 조사형 작업은
GPT-5.5를 먼저 검토하세요. - 로컬 Codex CLI/SDK·App/IDE에서는
gpt-5.5를 기본값 후보로 둡니다. ChatGPT 로그인과 API-key 인증 모두에서 지원하지만, 조직 rollout·비용·대기시간 정책에 따라gpt-5.4를 fallback으로 둘 수도 있습니다.
GPT-5.4
gpt-5.5의 사용량, 비용, latency, 조직 정책 탓에 보수적으로 운영해야 할 때 쓰는 fallback입니다.- 공식 문서는 GPT-5.3-Codex의 코딩 역량과 더 강한 reasoning, tool use, agentic workflow를 결합한 모델로 설명합니다.
- production automation에서 모델 가용성이 중요하면
gpt-5.4를 더 보수적인 기본값으로 둘 수 있습니다.
GPT-5.4-mini / GPT-5.3-Codex-Spark
- GPT-5.4-mini: 빠른 응답과 비용 효율이 중요한 보조 에이전트, 단순 수정, 반복 분석에 적합합니다.
- GPT-5.3-Codex-Spark: ChatGPT Pro 사용자의 research preview이며 text-only 빠른 반복 작업에 적합합니다. capability보다 latency가 중요한 경우에만 좁게 쓰세요.
릴리스 기반 운영 포인트 (0.123.0~0.139.0)
- GPT-5.5 API-key 지원 확인 (2026-06-12): 공식 Models 문서에서
gpt-5.5의 Codex CLI & SDK, Codex app & IDE extension, ChatGPT Credits, API Access가 모두 지원으로 표시됩니다. - Deprecated 모델 정리 (2026-06-12):
gpt-5.2와gpt-5.3-codex는 ChatGPT 로그인 기준 deprecated로 표시되므로 신규 팀 표준에서는 제거합니다. - Reasoning effort UX 보강 (0.138.0):
Altbinding이 불안정한 터미널을 위한 fallback shortcut이 들어왔고, model-defined effort levels가 모델이 광고한 순서대로 나옵니다. 팀 문서의 reasoning effort 목록은 고정 문자열보다 실제 picker/order를 먼저 확인하세요. - 이미지 path 인식 보강 (0.138.0~0.139.0): 로컬 이미지 첨부와 image generation 결과 path가 모델에 노출되고, image edit는 referenced file path를 따라가므로 browser/computer-use 검증에서 이미지 파일 위치를 더 명확히 관리해야 합니다.
- Python SDK 모델 운영 중요도 증가 (0.131.0~0.132.0): Python SDK가
openai-codex/openai_codex경로와 1급 auth/turn API로 정리되면서, 자동화 모델 선택을 CLI뿐 아니라 SDK 표준으로도 관리해야 합니다. - GPT-5.5 중심 전환 (0.123.0 + 2026-05 모델 문서): 기본 추천 모델이
gpt-5.5중심으로 바뀌었습니다. Alt+,reasoning quick cycle (0.124.0): 세션 중 reasoning level을 빠르게 바꿔 비용과 깊이를 조절할 수 있습니다.- model provider 주도 discovery (0.125.0): custom provider를 쓰는 팀은 모델 카탈로그가 Codex 내장 목록이 아니라 provider 응답에 더 직접 의존하게 됩니다.
- browser use와 model 선택 결합 (0.123.0 + App 26.423): browser use를 핵심 워크플로우로 쓰는 팀은
GPT-5.5를 더 자주 표준값으로 둘 근거가 생겼습니다. - Chrome 확장과 computer use 운영 (2026-05-07): 로그인된 브라우저 상태가 필요한 작업은 모델 성능뿐 아니라 allowlist, browser history, page trust 정책까지 함께 정해야 합니다.
팀 표준화 포인트
- 기본값: 로컬 Codex CLI/SDK·App/IDE는
gpt-5.5를 기본값 후보로 문서화합니다. - 브라우저 검증 중심 기본값: web app 디버깅, 디자인 검토, browser use/Chrome 확장이 많으면
GPT-5.5를 기본값 후보로 둡니다. - Reasoning effort 표준화: 팀 기본값을 정하되, 0.138.0 이후에는 모델이 광고한 effort 목록과 순서를
/modelpicker에서 다시 확인하세요.Alt+,나 fallback shortcut으로 임시 조정하는 기준만 허용하는 편이 안전합니다. - 리뷰 모델 분리:
/review용review_model을 별도로 둬 리뷰 단계만 더 넓은 추론을 쓰게 만들 수 있습니다. - 가벼운 subagent: 빠른 병렬 탐색에는
gpt-5.4-mini또는 Pro research preview인gpt-5.3-codex-spark를 좁게 씁니다. - Cloud task 분리: Codex cloud tasks는 현재 기본 모델을 사용자가 직접 바꿀 수 없으므로, 로컬 모델 표준과 Cloud 작업 표준을 분리해 문서화합니다.
실전 운영 패턴
1) 세션 중 전환: /model
/model은 활성 모델을 바꾸고(가능하면 reasoning effort도) 작업 단계에 맞게 조정할 때 사용합니다.
# GPT-5.5 (대부분의 Codex 작업 기본값 후보)
codex -m gpt-5.5
# GPT-5.4 (보수적 fallback)
codex -m gpt-5.4
# GPT-5.4-mini (가벼운 coding/subagent)
codex -m gpt-5.4-mini
# GPT-5.3-Codex-Spark (Pro research preview, 빠른 반복)
codex -m gpt-5.3-codex-spark2) 설정으로 고정: config.toml
# 예시
model = "gpt-5.5"
model_reasoning_effort = "medium"
# 보수적 fallback
# model = "gpt-5.4"
# /review를 별도 모델로 둘 때(선택)
# review_model = "gpt-5.5"3) 모델별 용도 비교
| 관점 | GPT-5.5 | GPT-5.4 | GPT-5.4-mini |
|---|---|---|---|
| 중심 용도 | 복잡한 코딩, browser/computer use, 리서치 | GPT-5.5 fallback, 범용 코딩 | 가벼운 coding/subagent |
| 강점 | 최신 frontier 품질, tool-heavy 작업, API-key 지원 | 안정적 availability, 기존 운영 표준 | 빠른 반복과 비용 효율 |
| 운영 포지션 | 로컬 Codex CLI/SDK·App/IDE 기본값 후보 | 보수적 fallback | 보조 agent / 저위험 작업 |
4) 비용/사용량 운영
모델/추론 수준을 올리면 그만큼 비용과 지연도 따라 늘어납니다. 팀에서는 pricing 페이지를 기준으로 "어떤 작업에 어느 등급을 허용할지"를 정책으로 정해 두는 편이 안전합니다.
참고 문서
- Models(추천 모델/대체 모델): https://developers.openai.com/codex/models (영어)
- Codex CLI(모델 전환): https://developers.openai.com/codex/cli (영어)
- 슬래시 커맨드(/model): https://developers.openai.com/codex/cli/slash-commands (영어)
- config 레퍼런스(model/review_model/reasoning): https://developers.openai.com/codex/config-reference (영어)
- Pricing: https://developers.openai.com/codex/pricing (영어)
- Changelog: https://developers.openai.com/codex/changelog (영어)
Ch11. MCP 연동
STDIO·Streamable HTTP MCP 서버 등록(codex mcp add), allowlist·enabled_tools·timeout 정책, resource/action 서버 분리와 plugin 마켓플레이스 라이프사이클로 외부 도구 연동을 통제하는 운영 가이드
Ch13. 거버넌스/롤아웃
read-only→workspace-write→CI→Cloud/MCP 단계적 롤아웃, requirements.toml 강제·SQLite 감사 로그·cloud-managed config·GPT-5.5 모델 거버넌스로 팀 도입을 통제하는 운영 원칙