Ch2. 버저닝·릴리즈
프롬프트/모델/툴/정책 변경을 추적 가능하게 배포하는 릴리즈 전략
AI 서비스의 릴리즈 단위는 코드만이 아닙니다.
프롬프트, 모델, 툴, 정책을 하나의 릴리즈 아티팩트로 관리해야 회귀를 통제할 수 있습니다.
버전 구성
| 구성요소 | 권장 버전 규칙 |
|---|---|
| Prompt | p-YYYYMMDD.N |
| Model | 공급자 모델 ID + 내부 호환 레벨 |
| Tool Schema | SemVer(major.minor.patch) |
| Policy Pack | 승인 이력 포함 해시 버전 |
릴리즈 파이프라인
오프라인 평가 기준을 충족합니다(정확도/안전성/비용).
보안 검증을 통과합니다(정책 테스트/PII 스캔/프롬프트 인젝션).
Canary 트래픽을 5~10%로 시작합니다.
오류율·지연·비용·보안 위반의 burn rate를 모니터링합니다.
문제가 없으면 점진적으로 확대합니다(25% → 50% → 100%).
승인 기준 예시
release_gate:
# 품질 및 성능 기준
quality_delta: '>= -1.0%'
cost_delta: '<= +5%'
p95_latency_delta: '<= +10%'
# 보안 기준
safety_violation_rate: '<= 0.2%'
pii_exposure_count: '== 0'
prompt_injection_test_pass_rate: '== 100%'
privilege_escalation_attempts: '== 0'
security_policy_test_coverage: '>= 95%'보안 검증 체크리스트
- 정책 테스트: 시스템 지시문 우회, 도구 접근 통제, 출력 필터링 검증
- PII 스캔: 프롬프트 템플릿, RAG 문서, 시스템 메시지에서 민감정보 탐지
- 인젝션 테스트: 직접적 프롬프트 우회, RAG 오염, 도구 결과 조작 방어 확인
보안 관련 롤백 조건
- PII 노출 감지 시 즉시 롤백
- 정책 우회 성공률 0.5% 초과 시
- 권한 상승 시도 감지 시
- 프롬프트 인젝션 성공 사례 발견 시
보안 우선 원칙
성능이나 품질 지표가 개선되더라도 보안 기준을 하나라도 충족하지 못하면 릴리즈를 진행하지 않습니다. 보안은 타협 불가능한 기준입니다.
실무 원칙
모델 업그레이드는 성능 개선보다 회귀 리스크가 큰 경우가 많습니다. 즉시 전환보다 병행 운영과 단계적 전환을 기본 전략으로 두세요.