Ch12. 모델/추론 전략

핵심 요약

2026-06-12 기준 gpt-5.5가 most tasks 시작점이며 ChatGPT 로그인과 API-key 인증 모두에서 지원되고, 보수적 운영이 필요하면 gpt-5.4를 fallback으로 명시합니다.
보조 에이전트·반복 작업은 gpt-5.4-mini, latency 우선 짧은 반복은 Pro용 text-only research preview인 gpt-5.3-codex-spark로 좁게 씁니다.
gpt-5.5-codex·gpt-5.5-mini·gpt-5.5-nano는 공식 추천 목록에 없고, gpt-5.2·gpt-5.3-codex는 ChatGPT 경로에서 deprecated이므로 /model picker로 재확인합니다.
세션 중에는 /model·Alt+,로 모델과 reasoning effort를 조정하되, 0.138.0 이후 effort 목록은 고정 문자열이 아니라 picker가 광고한 순서를 따릅니다.
/review용 review_model을 별도로 두고, Cloud task의 기본 모델은 사용자가 바꿀 수 없으므로 로컬 모델 표준과 분리해 문서화합니다.

Codex는 작업 성격에 맞춰 모델/추론 수준을 조정합니다. 시니어 개발자라면 분석과 구현을 나눠서 비용 대비 품질을 끌어올리는 게 좋습니다.

현재 추천 모델 (2026-06-12 KST 기준)

모델	특성	추천 용도
GPT-5.5	Codex가 대부분의 작업에 기본 추천하는 최신 frontier model	복잡한 코딩, browser use, computer use, 지식 작업, 리서치
GPT-5.4	GPT-5.3-Codex의 코딩 역량을 일반 reasoning/tool use와 합친 이전 flagship	안정적 범용 코딩, 보수적 fallback, GPT-5.5 과부하/정책 예외
GPT-5.4-mini	빠르고 효율적인 mini model	가벼운 코딩, 보조 에이전트, 비용 민감한 반복 작업
GPT-5.3-Codex-Spark	Pro 사용자용 text-only research preview, 빠른 실시간 반복에 최적화	짧은 탐색, 빠른 iteration, latency 우선 작업

기준점 변경: GPT-5.5 중심

공식 Codex Models 문서 기준으로 gpt-5.5가 most tasks 시작점입니다. 2026-06-12 재검증 기준 gpt-5.5는 ChatGPT 로그인과 API-key 인증 모두에서 Codex CLI/SDK·App/IDE에 지원됩니다. Codex cloud tasks의 기본 모델은 지금 사용자가 직접 바꿀 수 없으니, 로컬 CLI/SDK/App/IDE 모델 정책과 Cloud task 정책을 한 설정으로 묶지 마세요.

모델 이름 검증

2026-06-12 기준 공식 Codex Models 문서에는 gpt-5.5-codex, gpt-5.5-mini, gpt-5.5-nano가 추천 모델로 올라와 있지 않습니다. 과거 메모나 비공식 목록에서 본 이름이라면 팀 설정에 넣기 전에 /model picker와 공식 Models 페이지로 다시 확인하세요.

Deprecated Codex models

공식 Models 문서는 ChatGPT 로그인 경로의 gpt-5.2와 gpt-5.3-codex를 deprecated로 표시합니다. 기존 config, codex exec --model, runbook에 남아 있다면 추천 모델(gpt-5.5, gpt-5.4, gpt-5.4-mini, gpt-5.3-codex-spark) 중 하나로 옮기세요. API 쪽 가용성은 API models 페이지에서 따로 확인합니다.

모델별 역할 분리

GPT-5.5

공식 문서는 GPT-5.5를 복잡한 coding, computer use, knowledge work, research workflow에 적합한 최신 모델로 설명합니다.
프론트엔드 wide-context 탐색, 브라우저 검증, 도구를 섞어 쓰는 조사형 작업은 GPT-5.5를 먼저 검토하세요.
로컬 Codex CLI/SDK·App/IDE에서는 gpt-5.5를 기본값 후보로 둡니다. ChatGPT 로그인과 API-key 인증 모두에서 지원하지만, 조직 rollout·비용·대기시간 정책에 따라 gpt-5.4를 fallback으로 둘 수도 있습니다.

GPT-5.4

gpt-5.5의 사용량, 비용, latency, 조직 정책 탓에 보수적으로 운영해야 할 때 쓰는 fallback입니다.
공식 문서는 GPT-5.3-Codex의 코딩 역량과 더 강한 reasoning, tool use, agentic workflow를 결합한 모델로 설명합니다.
production automation에서 모델 가용성이 중요하면 gpt-5.4를 더 보수적인 기본값으로 둘 수 있습니다.

GPT-5.4-mini / GPT-5.3-Codex-Spark

GPT-5.4-mini: 빠른 응답과 비용 효율이 중요한 보조 에이전트, 단순 수정, 반복 분석에 적합합니다.
GPT-5.3-Codex-Spark: ChatGPT Pro 사용자의 research preview이며 text-only 빠른 반복 작업에 적합합니다. capability보다 latency가 중요한 경우에만 좁게 쓰세요.

릴리스 기반 운영 포인트 (0.123.0~0.139.0)

GPT-5.5 API-key 지원 확인 (2026-06-12): 공식 Models 문서에서 gpt-5.5의 Codex CLI & SDK, Codex app & IDE extension, ChatGPT Credits, API Access가 모두 지원으로 표시됩니다.
Deprecated 모델 정리 (2026-06-12): gpt-5.2와 gpt-5.3-codex는 ChatGPT 로그인 기준 deprecated로 표시되므로 신규 팀 표준에서는 제거합니다.
Reasoning effort UX 보강 (0.138.0): Alt binding이 불안정한 터미널을 위한 fallback shortcut이 들어왔고, model-defined effort levels가 모델이 광고한 순서대로 나옵니다. 팀 문서의 reasoning effort 목록은 고정 문자열보다 실제 picker/order를 먼저 확인하세요.
이미지 path 인식 보강 (0.138.0~0.139.0): 로컬 이미지 첨부와 image generation 결과 path가 모델에 노출되고, image edit는 referenced file path를 따라가므로 browser/computer-use 검증에서 이미지 파일 위치를 더 명확히 관리해야 합니다.
Python SDK 모델 운영 중요도 증가 (0.131.0~0.132.0): Python SDK가 openai-codex / openai_codex 경로와 1급 auth/turn API로 정리되면서, 자동화 모델 선택을 CLI뿐 아니라 SDK 표준으로도 관리해야 합니다.
GPT-5.5 중심 전환 (0.123.0 + 2026-05 모델 문서): 기본 추천 모델이 gpt-5.5 중심으로 바뀌었습니다.
Alt+, reasoning quick cycle (0.124.0): 세션 중 reasoning level을 빠르게 바꿔 비용과 깊이를 조절할 수 있습니다.
model provider 주도 discovery (0.125.0): custom provider를 쓰는 팀은 모델 카탈로그가 Codex 내장 목록이 아니라 provider 응답에 더 직접 의존하게 됩니다.
browser use와 model 선택 결합 (0.123.0 + App 26.423): browser use를 핵심 워크플로우로 쓰는 팀은 GPT-5.5를 더 자주 표준값으로 둘 근거가 생겼습니다.
Chrome 확장과 computer use 운영 (2026-05-07): 로그인된 브라우저 상태가 필요한 작업은 모델 성능뿐 아니라 allowlist, browser history, page trust 정책까지 함께 정해야 합니다.

팀 표준화 포인트

기본값: 로컬 Codex CLI/SDK·App/IDE는 gpt-5.5를 기본값 후보로 문서화합니다.
브라우저 검증 중심 기본값: web app 디버깅, 디자인 검토, browser use/Chrome 확장이 많으면 GPT-5.5를 기본값 후보로 둡니다.
Reasoning effort 표준화: 팀 기본값을 정하되, 0.138.0 이후에는 모델이 광고한 effort 목록과 순서를 /model picker에서 다시 확인하세요. Alt+,나 fallback shortcut으로 임시 조정하는 기준만 허용하는 편이 안전합니다.
리뷰 모델 분리: /review용 review_model을 별도로 둬 리뷰 단계만 더 넓은 추론을 쓰게 만들 수 있습니다.
가벼운 subagent: 빠른 병렬 탐색에는 gpt-5.4-mini 또는 Pro research preview인 gpt-5.3-codex-spark를 좁게 씁니다.
Cloud task 분리: Codex cloud tasks는 현재 기본 모델을 사용자가 직접 바꿀 수 없으므로, 로컬 모델 표준과 Cloud 작업 표준을 분리해 문서화합니다.

실전 운영 패턴

1) 세션 중 전환: `/model`

/model은 활성 모델을 바꾸고(가능하면 reasoning effort도) 작업 단계에 맞게 조정할 때 사용합니다.

# GPT-5.5 (대부분의 Codex 작업 기본값 후보)
codex -m gpt-5.5

# GPT-5.4 (보수적 fallback)
codex -m gpt-5.4

# GPT-5.4-mini (가벼운 coding/subagent)
codex -m gpt-5.4-mini

# GPT-5.3-Codex-Spark (Pro research preview, 빠른 반복)
codex -m gpt-5.3-codex-spark

2) 설정으로 고정: `config.toml`

# 예시
model = "gpt-5.5"
model_reasoning_effort = "medium"

# 보수적 fallback
# model = "gpt-5.4"

# /review를 별도 모델로 둘 때(선택)
# review_model = "gpt-5.5"

3) 모델별 용도 비교

관점	GPT-5.5	GPT-5.4	GPT-5.4-mini
중심 용도	복잡한 코딩, browser/computer use, 리서치	GPT-5.5 fallback, 범용 코딩	가벼운 coding/subagent
강점	최신 frontier 품질, tool-heavy 작업, API-key 지원	안정적 availability, 기존 운영 표준	빠른 반복과 비용 효율
운영 포지션	로컬 Codex CLI/SDK·App/IDE 기본값 후보	보수적 fallback	보조 agent / 저위험 작업

4) 비용/사용량 운영

모델/추론 수준을 올리면 그만큼 비용과 지연도 따라 늘어납니다. 팀에서는 pricing 페이지를 기준으로 "어떤 작업에 어느 등급을 허용할지"를 정책으로 정해 두는 편이 안전합니다.

참고 문서

Models(추천 모델/대체 모델): https://developers.openai.com/codex/models (영어)
Codex CLI(모델 전환): https://developers.openai.com/codex/cli (영어)
슬래시 커맨드(/model): https://developers.openai.com/codex/cli/slash-commands (영어)
config 레퍼런스(model/review_model/reasoning): https://developers.openai.com/codex/config-reference (영어)
Pricing: https://developers.openai.com/codex/pricing (영어)
Changelog: https://developers.openai.com/codex/changelog (영어)

핵심 요약

2026-06-12 기준 gpt-5.5가 most tasks 시작점이며 ChatGPT 로그인과 API-key 인증 모두에서 지원되고, 보수적 운영이 필요하면 gpt-5.4를 fallback으로 명시합니다.
보조 에이전트·반복 작업은 gpt-5.4-mini, latency 우선 짧은 반복은 Pro용 text-only research preview인 gpt-5.3-codex-spark로 좁게 씁니다.
gpt-5.5-codex·gpt-5.5-mini·gpt-5.5-nano는 공식 추천 목록에 없고, gpt-5.2·gpt-5.3-codex는 ChatGPT 경로에서 deprecated이므로 /model picker로 재확인합니다.
세션 중에는 /model·Alt+,로 모델과 reasoning effort를 조정하되, 0.138.0 이후 effort 목록은 고정 문자열이 아니라 picker가 광고한 순서를 따릅니다.
/review용 review_model을 별도로 두고, Cloud task의 기본 모델은 사용자가 바꿀 수 없으므로 로컬 모델 표준과 분리해 문서화합니다.

Codex는 작업 성격에 맞춰 모델/추론 수준을 조정합니다. 시니어 개발자라면 분석과 구현을 나눠서 비용 대비 품질을 끌어올리는 게 좋습니다.

현재 추천 모델 (2026-06-12 KST 기준)

모델	특성	추천 용도
GPT-5.5	Codex가 대부분의 작업에 기본 추천하는 최신 frontier model	복잡한 코딩, browser use, computer use, 지식 작업, 리서치
GPT-5.4	GPT-5.3-Codex의 코딩 역량을 일반 reasoning/tool use와 합친 이전 flagship	안정적 범용 코딩, 보수적 fallback, GPT-5.5 과부하/정책 예외
GPT-5.4-mini	빠르고 효율적인 mini model	가벼운 코딩, 보조 에이전트, 비용 민감한 반복 작업
GPT-5.3-Codex-Spark	Pro 사용자용 text-only research preview, 빠른 실시간 반복에 최적화	짧은 탐색, 빠른 iteration, latency 우선 작업

기준점 변경: GPT-5.5 중심

모델 이름 검증

Deprecated Codex models

모델별 역할 분리

GPT-5.5

공식 문서는 GPT-5.5를 복잡한 coding, computer use, knowledge work, research workflow에 적합한 최신 모델로 설명합니다.
프론트엔드 wide-context 탐색, 브라우저 검증, 도구를 섞어 쓰는 조사형 작업은 GPT-5.5를 먼저 검토하세요.
로컬 Codex CLI/SDK·App/IDE에서는 gpt-5.5를 기본값 후보로 둡니다. ChatGPT 로그인과 API-key 인증 모두에서 지원하지만, 조직 rollout·비용·대기시간 정책에 따라 gpt-5.4를 fallback으로 둘 수도 있습니다.

GPT-5.4

gpt-5.5의 사용량, 비용, latency, 조직 정책 탓에 보수적으로 운영해야 할 때 쓰는 fallback입니다.
공식 문서는 GPT-5.3-Codex의 코딩 역량과 더 강한 reasoning, tool use, agentic workflow를 결합한 모델로 설명합니다.
production automation에서 모델 가용성이 중요하면 gpt-5.4를 더 보수적인 기본값으로 둘 수 있습니다.

GPT-5.4-mini / GPT-5.3-Codex-Spark

GPT-5.4-mini: 빠른 응답과 비용 효율이 중요한 보조 에이전트, 단순 수정, 반복 분석에 적합합니다.
GPT-5.3-Codex-Spark: ChatGPT Pro 사용자의 research preview이며 text-only 빠른 반복 작업에 적합합니다. capability보다 latency가 중요한 경우에만 좁게 쓰세요.

릴리스 기반 운영 포인트 (0.123.0~0.139.0)

GPT-5.5 API-key 지원 확인 (2026-06-12): 공식 Models 문서에서 gpt-5.5의 Codex CLI & SDK, Codex app & IDE extension, ChatGPT Credits, API Access가 모두 지원으로 표시됩니다.
Deprecated 모델 정리 (2026-06-12): gpt-5.2와 gpt-5.3-codex는 ChatGPT 로그인 기준 deprecated로 표시되므로 신규 팀 표준에서는 제거합니다.
Reasoning effort UX 보강 (0.138.0): Alt binding이 불안정한 터미널을 위한 fallback shortcut이 들어왔고, model-defined effort levels가 모델이 광고한 순서대로 나옵니다. 팀 문서의 reasoning effort 목록은 고정 문자열보다 실제 picker/order를 먼저 확인하세요.
이미지 path 인식 보강 (0.138.0~0.139.0): 로컬 이미지 첨부와 image generation 결과 path가 모델에 노출되고, image edit는 referenced file path를 따라가므로 browser/computer-use 검증에서 이미지 파일 위치를 더 명확히 관리해야 합니다.
Python SDK 모델 운영 중요도 증가 (0.131.0~0.132.0): Python SDK가 openai-codex / openai_codex 경로와 1급 auth/turn API로 정리되면서, 자동화 모델 선택을 CLI뿐 아니라 SDK 표준으로도 관리해야 합니다.
GPT-5.5 중심 전환 (0.123.0 + 2026-05 모델 문서): 기본 추천 모델이 gpt-5.5 중심으로 바뀌었습니다.
Alt+, reasoning quick cycle (0.124.0): 세션 중 reasoning level을 빠르게 바꿔 비용과 깊이를 조절할 수 있습니다.
model provider 주도 discovery (0.125.0): custom provider를 쓰는 팀은 모델 카탈로그가 Codex 내장 목록이 아니라 provider 응답에 더 직접 의존하게 됩니다.
browser use와 model 선택 결합 (0.123.0 + App 26.423): browser use를 핵심 워크플로우로 쓰는 팀은 GPT-5.5를 더 자주 표준값으로 둘 근거가 생겼습니다.
Chrome 확장과 computer use 운영 (2026-05-07): 로그인된 브라우저 상태가 필요한 작업은 모델 성능뿐 아니라 allowlist, browser history, page trust 정책까지 함께 정해야 합니다.

팀 표준화 포인트

기본값: 로컬 Codex CLI/SDK·App/IDE는 gpt-5.5를 기본값 후보로 문서화합니다.
브라우저 검증 중심 기본값: web app 디버깅, 디자인 검토, browser use/Chrome 확장이 많으면 GPT-5.5를 기본값 후보로 둡니다.
Reasoning effort 표준화: 팀 기본값을 정하되, 0.138.0 이후에는 모델이 광고한 effort 목록과 순서를 /model picker에서 다시 확인하세요. Alt+,나 fallback shortcut으로 임시 조정하는 기준만 허용하는 편이 안전합니다.
리뷰 모델 분리: /review용 review_model을 별도로 둬 리뷰 단계만 더 넓은 추론을 쓰게 만들 수 있습니다.
가벼운 subagent: 빠른 병렬 탐색에는 gpt-5.4-mini 또는 Pro research preview인 gpt-5.3-codex-spark를 좁게 씁니다.
Cloud task 분리: Codex cloud tasks는 현재 기본 모델을 사용자가 직접 바꿀 수 없으므로, 로컬 모델 표준과 Cloud 작업 표준을 분리해 문서화합니다.

실전 운영 패턴

1) 세션 중 전환: `/model`

/model은 활성 모델을 바꾸고(가능하면 reasoning effort도) 작업 단계에 맞게 조정할 때 사용합니다.

# GPT-5.5 (대부분의 Codex 작업 기본값 후보)
codex -m gpt-5.5

# GPT-5.4 (보수적 fallback)
codex -m gpt-5.4

# GPT-5.4-mini (가벼운 coding/subagent)
codex -m gpt-5.4-mini

# GPT-5.3-Codex-Spark (Pro research preview, 빠른 반복)
codex -m gpt-5.3-codex-spark

2) 설정으로 고정: `config.toml`

# 예시
model = "gpt-5.5"
model_reasoning_effort = "medium"

# 보수적 fallback
# model = "gpt-5.4"

# /review를 별도 모델로 둘 때(선택)
# review_model = "gpt-5.5"

3) 모델별 용도 비교

관점	GPT-5.5	GPT-5.4	GPT-5.4-mini
중심 용도	복잡한 코딩, browser/computer use, 리서치	GPT-5.5 fallback, 범용 코딩	가벼운 coding/subagent
강점	최신 frontier 품질, tool-heavy 작업, API-key 지원	안정적 availability, 기존 운영 표준	빠른 반복과 비용 효율
운영 포지션	로컬 Codex CLI/SDK·App/IDE 기본값 후보	보수적 fallback	보조 agent / 저위험 작업

4) 비용/사용량 운영

참고 문서

Models(추천 모델/대체 모델): https://developers.openai.com/codex/models (영어)
Codex CLI(모델 전환): https://developers.openai.com/codex/cli (영어)
슬래시 커맨드(/model): https://developers.openai.com/codex/cli/slash-commands (영어)
config 레퍼런스(model/review_model/reasoning): https://developers.openai.com/codex/config-reference (영어)
Pricing: https://developers.openai.com/codex/pricing (영어)
Changelog: https://developers.openai.com/codex/changelog (영어)

현재 추천 모델 (2026-06-12 KST 기준)

모델별 역할 분리

GPT-5.5

GPT-5.4

GPT-5.4-mini / GPT-5.3-Codex-Spark

릴리스 기반 운영 포인트 (0.123.0~0.139.0)

팀 표준화 포인트

실전 운영 패턴

1) 세션 중 전환: `/model`

2) 설정으로 고정: `config.toml`

3) 모델별 용도 비교

4) 비용/사용량 운영

참고 문서

목차

Ch12. 모델/추론 전략

현재 추천 모델 (2026-06-12 KST 기준)

모델별 역할 분리

GPT-5.5

GPT-5.4

GPT-5.4-mini / GPT-5.3-Codex-Spark

릴리스 기반 운영 포인트 (0.123.0~0.139.0)

팀 표준화 포인트

실전 운영 패턴

1) 세션 중 전환: `/model`

2) 설정으로 고정: `config.toml`

3) 모델별 용도 비교

4) 비용/사용량 운영

참고 문서

목차