Cmd. /fast
Opus fast mode를 켜고 끄는 속도 우선 명령 (research preview)
핵심 요약
/fast [on|off]는 같은 Opus를 속도 우선 API 설정으로 돌려 최대 2.5배 빠르게 만드는 fast mode를 토글합니다. 품질·기능은 표준 모드와 동일합니다.- Opus 4.8·4.7·4.6에서만 지원되며 CLI 전용입니다. Sonnet·Haiku·Fable 5와 VS Code 확장에서는 쓸 수 없습니다.
- Anthropic Console API와 구독 플랜에서만 동작하고 usage credits가 필요합니다. 플랜 잔여량과 무관하게 첫 토큰부터 크레딧에서 차감됩니다.
- 토큰 단가가 높습니다(Opus 4.8 입력 50, 4.7·4.6은 150/MTok). 세션 초반에 켜는 편이 비용에 유리합니다.
- 끄더라도 모델은 Opus로 유지됩니다. 이전 모델로 돌아가려면
/model을 쓰세요. research preview라 기능·가격이 바뀔 수 있습니다.
명령어 원본 선언
/fast [on|off]공식 설명 요약
/fast는 fast mode를 켜고 끄는 명령입니다.
공식 명령어 표의 설명은 "Toggle fast mode on or off"입니다.
fast mode는 Claude Opus가 더 빠르게 응답하도록 구성한 고속 설정입니다. 토큰당 비용은 더 비싸지만 모델이 최대 2.5배 빨라집니다. 별도 모델이 아니라 같은 Opus를 속도 우선 API 설정으로 돌리는 것이라, 품질과 기능은 표준 모드와 똑같습니다.
- fast mode는 Opus 4.8 · Opus 4.7 · Opus 4.6에서 지원되며, Sonnet · Haiku 등 다른 모델에서는 사용할 수 없습니다. Fable 5는 현재 fast mode 지원 대상이 아닙니다.
- 아직 research preview 기능입니다. 기능·가격·제공 범위가 피드백에 따라 바뀝니다.
- CLI 전용입니다. VS Code 확장에서는 지원되지 않습니다.
최소 지원 버전
- fast mode는 Claude Code
v2.1.36이상이 필요합니다 (claude --version으로 확인). - fast mode의 기본 모델 버전:
v2.1.154이상: Opus 4.8이 fast mode 기본값v2.1.142~v2.1.153: Opus 4.7이 fast mode 기본값- Opus 4.6으로 고정하려면
CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1설정 (Opus 4.6 fast mode 은퇴 시 이 override도 제거됨)
사용법
토글 방식은 두 가지입니다.
# /fast 입력 후 Tab으로 on/off 토글
/fast# 인자로 명시적 지정
/fast on
/fast off사용자 설정 파일에서 "fastMode": true로 켤 수도 있습니다.
{
"fastMode": true
}켜지면 다음이 표시됩니다.
- 다른 모델을 쓰고 있었다면 자동으로 Opus로 전환됩니다.
- "Fast mode ON" 확인 메시지가 뜹니다.
- fast mode가 활성화된 동안 프롬프트 옆에 작은
↯아이콘이 나타납니다. /fast를 다시 실행하면 현재 on/off 상태를 확인하거나 끌 수 있습니다.
/fast로 꺼도 모델은 Opus로 유지됩니다. 이전 모델로 되돌아가지 않으니 다른 모델을 쓰려면
/model을 사용하세요.
fast mode 설정은 기본적으로 세션 간에 유지됩니다. 관리자가 세션마다 초기화되도록 설정할 수도 있습니다.
좋은 사용 예
응답 지연이 비용보다 더 중요한 인터랙티브 작업에 적합합니다.
- 코드 변경의 빠른 반복(rapid iteration)
- 라이브 디버깅 세션
- 마감이 촉박한 시간 민감 작업
- 낮은 effort와 결합해 단순 작업을 최대 속도로 처리할 때
비슷한 명령어 추천
| 명령어 | 차이점 | 언제 선택 |
|---|---|---|
/fast | 같은 품질의 Opus를 더 낮은 지연으로 | 지연 시간이 비용보다 중요할 때 |
/effort | 사고 시간(thinking) 조절 → 속도/품질 | 복잡도와 품질 균형 조정 |
/model | 모델 자체 전환 | 모델/공급자 정책 변경 |
/usage | 사용량·비용 확인 (/cost 별칭) | fast mode 비용 영향 점검 |
fast mode와 effort level은 둘 다 속도에 영향을 주지만 방식이 다릅니다. fast mode는 모델 품질은 그대로 두고 지연만 낮추는 대신 비용을 올립니다. effort를 낮추면 thinking 시간이 줄어 더 빨라지지만 복잡한 작업에서는 품질이 떨어질 수 있습니다. 둘을 같이 쓰면 단순 작업의 속도를 극대화할 수 있습니다.
활용 사례
- 긴 대기 없이 편집-실행-검토 루프 반복
- 데모 중 응답 지연 최소화
- 장애 대응 중 빠른 원인 후보 좁히기
비용·요금 (research preview)
fast mode는 표준 Opus보다 토큰당 단가가 높으며, 배수는 모델에 따라 다릅니다.
| 모델 | 입력 (MTok) | 출력 (MTok) |
|---|---|---|
| Opus 4.8 | $10 | $50 |
| Opus 4.7 · Opus 4.6 | $30 | $150 |
- fast mode 단가는 1M 토큰 전체 컨텍스트 구간에서 동일하게(flat) 적용됩니다.
- 대화 중간에 fast mode로 전환하면 그 시점까지의 전체 컨텍스트 입력 토큰이 fast mode 비캐시 단가로 다시 과금됩니다. 세션 초반에 켜는 편이 비용 면에서 유리합니다.
- 표준 Opus 단가와 비교하려면 Claude 가격 안내를 참고하세요.
주의사항
- 공급자 제약: fast mode는 Anthropic Console API와 구독 플랜(usage credits)에서만 사용할 수 있습니다. Amazon Bedrock · Google Vertex AI · Microsoft Azure Foundry · Claude Platform on AWS에서는 사용할 수 없습니다.
- usage credits 필요: 계정에 usage credits(플랜 포함량 초과 과금 허용)가 켜져 있어야 합니다. 구독 플랜(Pro/Max/Team/Enterprise)에서도 fast mode 사용량은 플랜에 남은 사용량과 무관하게 첫 토큰부터 usage credits에서 직접 차감됩니다.
- Team/Enterprise: 기본적으로 비활성화되어 있어 관리자가 명시적으로 켜야 합니다.
관리자가 켜지 않았다면
/fast실행 시 "Fast mode has been disabled by your organization"이 표시됩니다. - 세션별 opt-in: 관리자가 managed settings에서
fastModePerSessionOptIn을true로 설정하면 각 세션이 fast mode 꺼진 상태로 시작합니다. - fast mode 완전 비활성화:
CLAUDE_CODE_DISABLE_FAST_MODE=1환경 변수로 끌 수 있습니다. - Opus 4.6 deprecation: Opus 4.6 fast mode는 deprecated 상태로, Opus 4.8 출시 약 30일 후 제거됩니다. 제거 후 Opus 4.6에서는 표준 속도·표준 가격으로 폴백됩니다. 속도 이점을 유지하려면 Opus 4.8이나 4.7로 옮기세요.
- rate limit: fast mode는 표준 Opus와 별도의 rate limit pool을 가지며, Opus 4.8 · 4.7 ·
4.6은 같은 pool을 공유합니다. 한도에 도달하거나 usage credits가 소진되면 자동으로 표준
속도·표준 가격으로 폴백되고
↯아이콘이 회색으로 바뀝니다. 쿨다운이 끝나면 자동 재활성화됩니다.
출처
- Commands: https://code.claude.com/docs/en/commands
- Fast mode: https://code.claude.com/docs/en/fast-mode