Skip to main content

멀티 모델 전략

Claude는 Opus, Sonnet, Haiku 세 가지 모델 패밀리에 더해, Opus보다 상위 티어인 Mythos-class를 제공합니다(일반 공개 모델은 Fable 5, 2026년 6월 출시). 모든 작업에 가장 강력한 모델을 쓰면 비용이 커지고, 약한 모델만 쓰면 품질이 떨어집니다. 멀티 모델 전략은 작업 유형에 따라 적합한 모델을 선택해 성능과 비용을 동시에 최적화합니다.

모델 비교

모델특징적합한 작업상대 비용
Fable 5일반 공개 모델 중 최고 성능(Mythos-class), 1M 기본가장 까다로운 추론, 장시간 자율 작업$$$$$$
Opus 4.8Opus 티어 최고 성능, 복잡한 추론, 1M 컨텍스트아키텍처 설계, 복잡한 알고리즘$$$$$
Sonnet 4.6균형 잡힌 성능, 1M 컨텍스트일반 코딩, 리뷰, 문서화$$$
Haiku 4.5빠르고 저렴간단한 수정, 포맷팅, 분류$

Fable 5는 API 기준 $10/$50(MTok 입력/출력)으로 Opus 4.8 표준가($5/$25)의 2배입니다. 공식 문서의 기본 권장 출발점은 여전히 Opus 4.8이고, Fable 5는 "가장 높은 가용 성능이 필요한 워크로드"용 상위 옵션입니다.

기본 모델은 플랜에 따라 다릅니다
  • Max / Team Premium / Enterprise 종량제 / API: 기본 Opus 4.8 (사용량 임계치 도달 시 Sonnet으로 자동 폴백)
  • Pro / Team Standard / Enterprise 구독 시트: 기본 Sonnet 4.6

Fable 5는 어떤 플랜에서도 기본 모델이 아닙니다. /model fable로 직접 선택해야 하며, 선택하면 사용자 설정에 저장되어 이후 세션도 Fable 5로 시작합니다. Fable 5는 Claude Code v2.1.170 이상이 필요하고, zero data retention 환경에서는 사용할 수 없습니다.

default 별칭은 플랜에 맞는 권장 모델로 자동 복귀합니다. Opus 4.8은 Claude Code v2.1.154 이상이 필요합니다(claude update로 업그레이드).

/model 명령어나 --model 플래그로 모델을 변경할 수 있습니다. 모델 별칭(default, best, fable, opus, sonnet, haiku, opusplan, opus[1m], sonnet[1m])도 사용 가능합니다. best는 조직이 Fable 5에 접근 가능하면 Fable 5, 아니면 최신 Opus를 사용합니다. v2.1.153부터 /model로 고른 모델은 새 세션의 기본값으로 저장됩니다.

opusplanPlan 모드에서 Opus, 실행 모드에서 Sonnet을 자동 전환하는 하이브리드 별칭입니다. Opus의 추론 능력과 Sonnet의 효율성을 결합합니다.

모델 선택 기준

Opus를 써야 할 때

  • 전체 시스템 아키텍처 설계
  • 복잡한 버그의 근본 원인 분석
  • 성능 최적화 전략 수립
  • 보안 취약점 분석
  • 처음 보는 대규모 코드베이스 이해
claude --model claude-opus-4-8 "이 마이크로서비스 아키텍처의 병목을 분석하고 개선 방안을 제시해줘"

Sonnet을 써야 할 때

  • 일반적인 기능 구현
  • 코드 리뷰 및 리팩토링
  • 테스트 코드 작성
  • API 연동 및 데이터 처리
  • 문서화 및 주석 작성
# 기본값이 Sonnet이므로 별도 지정 불필요
claude "사용자 인증 미들웨어 구현해줘"

Haiku를 써야 할 때

  • 파일 포맷팅 및 정리
  • 간단한 이름 변경, 타입 수정
  • 반복적인 보일러플레이트 생성
  • 코드 번역 (언어 변환)
  • 로그 분석 및 단순 분류
claude --model claude-haiku-4-5-20251001 "이 JSON을 TypeScript 타입으로 변환해줘"

서브에이전트 멀티 모델 전략

Claude Code의 Task 도구를 활용하면 작업을 여러 모델에 분산할 수 있습니다. 이를 오케스트레이터-서브에이전트 패턴이라 합니다.

패턴: 계획은 Opus, 실행은 Sonnet

사용자 요청 → Opus(계획 수립) → Sonnet × N (병렬 실행)

실제 CLAUDE.md 설정 예시:

# 작업 전략
- 복잡한 아키텍처 결정: 반드시 상세 계획을 먼저 세우고 실행
- 반복 작업(파일 10개 이상 수정): 병렬 처리 고려
- 포맷팅, 주석 추가: 빠른 처리 우선

패턴: 검토는 강하게, 구현은 빠르게

# 1단계: Haiku로 빠르게 초안 작성
claude --model claude-haiku-4-5-20251001 "CRUD API 보일러플레이트 생성해줘"

# 2단계: Sonnet으로 리뷰 및 개선
claude "방금 작성한 코드 리뷰하고 개선해줘"

# 3단계: 필요시 Opus로 심층 분석
claude --model claude-opus-4-8 "이 코드의 보안 취약점 분석해줘"

모델 선택 결정 트리

새 작업이 들어왔을 때:

1. 작업이 모호하거나 창의적인가?
→ YES: 먼저 Sonnet으로 탐색, 필요시 Opus

2. 코드베이스를 처음 이해해야 하나?
→ YES: Opus로 전체 구조 파악

3. 반복적이고 패턴이 명확한가?
→ YES: Haiku로 충분

4. 그 외 일반적인 개발 작업?
→ Sonnet (기본값)

실전 적용: 프로젝트 단계별 모델 전략

프로젝트 초기 단계 — Opus 집중

# 요구사항 분석 및 아키텍처 설계
claude --model claude-opus-4-8 "이 요구사항 문서를 분석해서
최적의 데이터베이스 스키마와 API 구조를 설계해줘: [요구사항]"

개발 단계 — Sonnet 중심

# 일반 기능 구현 (기본값 Sonnet 사용)
claude "설계한 스키마 기반으로 User 서비스 구현해줘"
claude "회원가입 API 테스트 코드 작성해줘"

반복 작업 — Haiku 활용

# 포맷팅, 주석, 단순 변환
claude --model claude-haiku-4-5-20251001 "모든 컨트롤러 파일에 JSDoc 주석 추가해줘"

코드 리뷰 단계 — Sonnet + 필요시 Opus

# 일반 리뷰
claude "PR 변경사항 리뷰해줘"

# 보안/성능 심층 분석
claude --model claude-opus-4-8 "결제 모듈 보안 감사해줘"

Effort Level (노력 수준)

모델 선택 외에도 effort level로 응답 속도와 품질을 조절할 수 있습니다. 태스크 복잡도에 따라 thinking을 동적으로 조절합니다. 지원하는 수준은 모델에 따라 다릅니다:

수준설명적합한 상황
low빠르고 저렴, 최소한의 thinking짧고 범위가 좁은 작업
medium토큰 절약, 비용 민감 작업일반 코딩 작업
high균형 (Opus 4.8 기본값)대부분의 코딩 작업
xhigh더 깊은 추론, 토큰 더 사용 (Opus 4.7 기본값)아키텍처 설계, 난이도 높은 버그
max토큰 제약 없는 최대 추론 (세션 한정)까다로운 작업. 과추론 주의
  • Fable 5 / Opus 4.8 / Opus 4.7: low·medium·high·xhigh·max 5단계 지원
  • Opus 4.6 / Sonnet 4.6: low·medium·high·max 지원 (xhigh 미지원 → high로 폴백)
  • 기본값: Fable 5·Opus 4.8·4.6·Sonnet 4.6 = high, Opus 4.7 = xhigh
# 환경변수로 설정
CLAUDE_CODE_EFFORT_LEVEL=low claude

# /effort 슬라이더 또는 /model 메뉴에서 좌우 화살표로 조절 가능
ultracode — effort가 아니라 Claude Code 설정

/effort 메뉴에 ultracode가 있습니다. 이건 모델 effort 수준이 아니라 Claude Code 설정입니다 — 모델에는 xhigh를 보내고, 추가로 큰 작업을 동적 워크플로우로 쪼개 여러 서브에이전트를 조율합니다. 현재 세션에만 적용됩니다. 작업량(토큰)을 많이 쓰므로 큰 병렬 작업이 필요할 때만 켜는 게 좋습니다.

Fast Mode

/fast 명령으로 Opus의 응답 속도를 높일 수 있습니다 (토큰 비용 증가). Opus 4.8에서는 fast mode 단가가 더 낮아졌습니다. 빠른 반복 작업이나 실시간 디버깅에 유용합니다. Effort level과 조합하면 최대 속도를 얻을 수 있습니다.

Fast mode는 Opus 전용입니다(4.8·4.7·4.6) — Fable 5는 지원하지 않으며, 다른 모델에서 fast mode를 켜면 Opus로 자동 전환됩니다.

adaptive reasoning

Opus 4.7부터는 항상 adaptive reasoning(태스크 복잡도에 따라 thinking을 동적 배분)을 사용하며, Fable 5도 마찬가지입니다. CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING로 끄는 고정 thinking budget 모드는 Opus 4.6·Sonnet 4.6에만 적용됩니다.

특히 Fable 5에서는 thinking 자체를 끌 수 없습니다 — 세션 토글, alwaysThinkingEnabled 설정, MAX_THINKING_TOKENS=0 모두 효과가 없습니다.

비용 절감 실전 팁

1. Haiku로 먼저 탐색

무엇을 해야 할지 모를 때, 비싼 모델로 바로 실행하지 말고:

# 먼저 Haiku로 방향 파악
claude --model claude-haiku-4-5-20251001 "이 에러의 원인이 뭔지 간략히 설명해줘"

# 방향이 잡히면 Sonnet으로 해결
claude "이 에러 고쳐줘: [구체적인 에러]"

2. 컨텍스트 최소화

모델 비용은 입력 토큰 수에도 비례합니다. 불필요한 파일을 포함시키지 마세요:

# 비효율: 전체 코드베이스 컨텍스트에서 간단한 수정
# 효율: 관련 파일만 명시
claude "src/utils/format.ts 의 formatDate 함수만 수정해줘"

3. 배치 처리

유사한 작업은 한 번의 요청으로 묶어서 처리:

# 비효율: 파일마다 개별 요청
# 효율: 한 번에 묶어서
claude "src/models/ 안의 모든 모델 파일에 timestamps 필드 추가해줘"

모델 능력 비교 요약

실제로 느껴지는 차이:

Haiku: "이 함수 이름 camelCase로 바꿔줘" → 즉시, 정확하게 Sonnet: "이 서비스 레이어 아키텍처를 개선해줘" → 맥락 파악 후 적절한 제안 Opus: "10만 줄 규모의 레거시 시스템을 현대화하는 전략을 세워줘" → 깊은 분석, 단계별 계획

실용적 조언

대부분의 일상적인 코딩 작업은 Sonnet으로 충분합니다. Opus는 "이 문제를 어떻게 접근해야 할지 모르겠을 때"를 위해 아껴두세요. Haiku는 "분명히 쉬운 작업인데 빠르게 해결하고 싶을 때" 활용하세요.