검증 리포트
하네스 엔지니어링 핸드북의 링크·정합성·근거 검증 결과
이 문서는 하네스 엔지니어링 핸드북의 구조, 근거, 교차 링크, handbook 앱 수준 정적 검증 결과를
기록합니다.
검증 기준일
2026년 4월 1일
검증 범위
| 항목 | 기준 |
|---|---|
| 문서 구조 | meta.json 선언과 실제 MDX 파일 일치 여부 |
| 내용 정합성 | 핵심 주장과 장 구성이 서로 충돌하지 않는지 |
| 외부 근거 | OpenAI, Anthropic, Toss, gstack, revfactory/harness를 근거로 삼는 구간 점검 |
| 교차 링크 | 관련 핸드북과의 연결성 확인 |
| 앱 검증 | handbook 범위 lint, typecheck, build 결과 |
검증 방법
apps/handbook/content/books/harness-engineering/meta.json과 실제 MDX 파일 목록을 대조했습니다.- 각 장의 주장을 외부 자료의 핵심 메시지와 비교해 과도한 일반화가 없는지 확인했습니다.
LLMOps·AgentOps,Codex,Claude Code,오케스트레이션,문서화책과의 링크를 확인했습니다.- handbook 범위
lint,typecheck,build를 실행해 정적 검증을 확인했습니다.
결과 요약
| 항목 | 결과 |
|---|---|
meta.json와 실제 MDX 파일 | 23개 페이지 기준 일치 |
| 구조 흐름 | 이상 없음 |
| 외부 근거 연결 | 이상 없음 |
| 교차 링크 | 이상 없음 |
yarn lint --filter=handbook | 통과 |
yarn typecheck --filter=handbook | 통과 |
NEXT_DIST_DIR=.next yarn build --filter=handbook | 통과 |
핵심 근거 목록
| 자료 | 발행일 | 이 책에서 사용한 포인트 |
|---|---|---|
| OpenAI, Harness Engineering | 2026-02-11 | agent-readable repo, 짧은 AGENTS.md, 구조화된 docs, 관측성, 가비지 컬렉션 |
| Anthropic, Harness design for long-running application development | 2026-03-24 | planner/generator/evaluator, 모델 성능에 따라 바뀌는 load-bearing 구조 |
| Toss, Harness를 통한 조직 생산성 저점 높이기 | 2026-02-26 | frictionless harness, executable SSOT, domain layer, HITL |
| gstack README | 2026-04-01 열람 기준 | 강한 opinion의 역할별 workflow, "Fork it. Improve it. Make it yours." |
| revfactory/harness README | 2026-04-01 열람 기준 | 하네스 생성 파이프라인, 도메인별 agent team 설계 |
추론으로 정리한 구간
아래 내용은 특정 한 문서의 직설적 표현이 아니라 여러 자료를 종합한 해석입니다.
| 구간 | 해석 근거 |
|---|---|
| "하네스는 프롬프트보다 작업 시스템 설계에 가깝다" | OpenAI의 repo/observability 강조 + Anthropic의 구조적 evaluation + Toss의 시스템 해석 |
| "범용 하네스는 출발점, 팀 고유 하네스는 목적지" | Toss의 domain layer/HITL + gstack의 make it yours + revfactory의 domain-specific teams |
| "운영과 cleanup은 하네스의 일부" | OpenAI의 entropy/doc gardening 관점 |
챕터별 검증 결과
| 챕터 | 확인 포인트 | 결과 |
|---|---|---|
foundations | 프롬프트/컨텍스트/하네스 구분 | 이상 없음 |
repo-readable-systems | OpenAI/Toss 기반 repo/doc/SSOT 해석 | 이상 없음 |
five-elements | 환경, 역할, 기준, 루프, 정리의 5축 일관성 | 이상 없음 |
engineering-mechanics | 입력/상태/도구/권한 경계를 엔지니어링 문제로 설명하는지 | 이상 없음 |
evaluation-loops | planner/evaluator/browser QA 분리 기준 | 이상 없음 |
case-studies | 사례별 포인트가 서로 섞이지 않는지 | 이상 없음 |
case-openai | repo-readable/observability/cleanup 해석 | 이상 없음 |
case-anthropic | load-bearing scaffolding, retry budget 해석 | 이상 없음 |
case-toss | executable SSOT, domain layer, HITL 해석 | 이상 없음 |
case-gstack | sprint, command, release gate 해석 | 이상 없음 |
case-revfactory | domain-first harness generation 해석 | 이상 없음 |
domain-playbooks | 사례를 도메인 적용 모델로 연결하는지 | 이상 없음 |
scenario-frontend-team | browser QA, a11y, design rules의 load-bearing 포인트 | 이상 없음 |
scenario-platform-team | invariants, impact analysis, release gate 해석 | 이상 없음 |
scenario-payments-team | approval, reconciliation, audit trail 해석 | 이상 없음 |
scenario-ai-product-team | eval set, canary, telemetry 해석 | 이상 없음 |
make-it-yours | 개인 노하우와 팀 운영체계의 구분 | 이상 없음 |
team-rollout | 개인 루틴 -> 팀 workflow 확장 경로 | 이상 없음 |
checklist | 바로 적용 가능한 질문으로 정리됐는지 | 이상 없음 |
operations | 운영과 가비지 컬렉션 관점 반영 | 이상 없음 |
교차 링크 확인
| 대상 책 | 연결 방식 | 상태 |
|---|---|---|
/books/llmops-agentops | 운영 체계 연결 | 확인 |
/books/agent-orchestration-patterns | 멀티에이전트 설계 연결 | 확인 |
/books/agentic-documentation | AI-readable 문서 연결 | 확인 |
/books/codex-advanced | Codex 환경 설계 연결 | 확인 |
/books/claude-code-advanced | Claude Code 환경 설계 연결 | 확인 |
검증 한계
범위 안내
이 리포트는 2026년 4월 1일 기준의 문서 구조와 해석을 검증합니다.
외부 자료는 빠르게 변할 수 있으므로, 실제 주장 변화가 생기면 updates.mdx에 해석 변경 로그를 먼저
남겨야 합니다.