부록 A. 런북 템플릿
Prisma 프로덕션 운영을 위한 배포/장애/복구 템플릿 모음
1) 마이그레이션 배포 런북
# Migration Deployment Runbook
## 기본 정보
- 서비스:
- 환경:
- 변경 ID:
- 담당자(IC):
- 관측 대시보드 링크:
## 사전 점검
- [ ] staging 리허설 완료
- [ ] 백업/복구 포인트 확인
- [ ] 롤백 계획 검토
- [ ] 커뮤니케이션 채널 준비
## 실행 절차
1. 읽기/쓰기 트래픽 상태 확인
2. npx prisma migrate deploy 실행
3. 상태 확인 (npx prisma migrate status)
4. 핵심 지표 30분 모니터링
## 실패 시
- [ ] 코드 롤백 판단
- [ ] DB 상태 스냅샷 캡처
- [ ] migrate resolve 필요 여부 점검
- [ ] 사고 공지 템플릿 배포2) 장애 대응 런북
# Prisma Incident Runbook
## 탐지
- 알림 유형:
- 최초 탐지 시각:
- 사용자 영향:
## 완화
- [ ] 기능 플래그 비활성화
- [ ] 트래픽 제한/큐 적재
- [ ] 비핵심 배치 중지
## 진단
- [ ] DB 연결 수/락/슬로우쿼리 확인
- [ ] 최근 배포/마이그레이션 이력 확인
- [ ] 외부 의존성 상태 확인
## 복구
- [ ] 코드 롤백 또는 패치
- [ ] 데이터 정합성 검증
- [ ] 모니터링 임계치 임시 강화
## 종료 기준
- [ ] 에러율 정상화
- [ ] 지연 시간 정상화
- [ ] 운영 승인 후 인시던트 종료3) 복구 리허설 런북
# DR Drill Runbook
## 시나리오
- 유형: 삭제 사고 | 스키마 사고 | 리전 장애
- 목표 RPO/RTO:
## 절차
1. 지정 시점 백업 선택
2. 격리 환경 복원
3. 핵심 데이터 정합성 점검
4. 애플리케이션 연결 테스트
5. 결과 기록 및 갭 분석
## 결과
- 실제 RPO:
- 실제 RTO:
- 실패/병목 포인트:
- 개선 액션:4) 포스트모템 템플릿
# Incident Postmortem
- Incident ID:
- 기간:
- 영향 요약:
## Timeline
- 09:32 탐지
- 09:35 완화 시작
- 09:48 코드 롤백 완료
- 10:20 서비스 정상화
## Root Cause
- 직접 원인:
- 근본 원인:
## What Went Well
-
## What Went Wrong
-
## Action Items
- [ ] 항목 / 담당자 / 기한