업데이트 내역
하네스 엔지니어링 핸드북 변경 로그
최종 업데이트
2026년 6월 13일
운영 원칙
- 근거 기반: 외부 자료를 읽은 날짜와 자료 발행일을 함께 기록합니다.
- 해석 우선: 새 소식을 적는 것보다, 그 변화가 이 책의 해석을 어떻게 바꾸는지 먼저 적습니다.
- 문서 구조와 해석 분리: 목차 수정, 역링크 추가 같은 편집 변화와 관점 변화는 나눠 기록합니다.
- 관찰 목록 유지: 어떤 소스를 계속 볼지 명시해 업데이트 감각이 개인 의존이 되지 않게 합니다.
관찰할 외부 소스
| 소스 | 확인할 것 | 주기 |
|---|---|---|
| OpenAI Harness Engineering | repo 구조, observability, cleanup 관점 변화 | 분기별 |
| OpenAI Agents SDK / API Changelog | model-native harness, sandbox, MCP, skills, open-source harness, Secure MCP 변화 | 월간 |
| OpenAI Codex docs | hooks, remote connection, approval, MCP/security, plugin 운영 변화 | 월간 |
| Anthropic Harness / Managed Agents / auto mode | planner/evaluator/load-bearing, session-harness-sandbox 분리, permission classifier 구조 변화 | 월간 |
| Anthropic domain agent templates | 도메인별 skills/connectors/subagents/approval flow 패키징 변화 | 분기별 |
| Toss 하네스 글 | 조직 적용 관점, domain/HITL 해석 | 반기별 |
| gstack | 역할 체계, QA/ship 흐름, install 패턴 변화 | 월간 |
| revfactory/harness | harness generation 패턴과 팀 설계 방식 변화 | 월간 |
변경 기록
2026-06-13
문서 구조 변경
- 핸드북 전체 리뷰·최신화 라운드에서 이 핸드북을 점검
case-revfactory.mdx: 실행 모드 비교표의 오타 교정 (한 번성 전문 작업→일회성 전문 작업)index.mdx의updatedAt을 2026-06-13으로 갱신
해석 변경
- 없음 (관점·구조 변화 없이 표기 정리 수준의 수정)
영향 챕터
index.mdxcase-revfactory.mdxupdates.mdx
2026-05-23
문서 구조 변경
index.mdx의updatedAt을 2026-05-23으로 갱신- OpenAI Agents SDK, Codex remote/hook, Secure MCP Tunnel 흐름을
foundations,repo-readable-systems,engineering-mechanics,case-openai,case-studies에 반영 - 추가 원문 재검토 후 Anthropic Managed Agents, Claude Code auto mode, financial agents, OpenAI Developers
plugin을 좁은 근거 범위로 2차 반영
case-anthropic에 session/harness/sandbox 분리, durable session log, credential vault/MCP proxy, auto approval classifier 추가engineering-mechanics,checklist,operations에 자동 승인 정책, trust boundary, deny rule, classifier denial 지표 추가domain-playbooks,team-rollout에 domain agent template과 provider plugin 배포 단위 추가
case-gstack을 2026-05-23 기준 README 상태로 보강- 23 specialists + 8 power tools
- 10개 AI coding agent host 지원
- team mode auto-update
- iOS live-device QA, checkpoint, learning/domain-skill 흐름
case-revfactory를 2026-05-23 기준 README 상태로 보강- v1.2.0, L3 Meta-Factory / Team-Architecture Factory 포지션
- Agent Teams vs Subagents 실행 모드
- marketplace install, Harness 100, author-measured A/B caveat
team-rollout,checklist,operations에 sandbox, MCP, hooks, remote approval, runtime surface drift 점검 항목 추가verification.mdx의 기준일과 핵심 근거 목록을 갱신books-data.ts의 하네스 업데이트 요약 갱신
해석 변경
- 이전 해석: 하네스는 리포, 문서, 평가 루프, 승인, 운영 정리를 팀에 맞게 설계하는 작업 시스템이다.
- 새 해석: 그 관점은 유지하되, 2026년 4~5월 이후 하네스의 일부 요소가 MCP, skills, sandbox, hooks, remote approvals, open-source harness 같은 표준 primitive로 제품화되고 있다.
- 변경 이유: OpenAI의 2026-04-15 Agents SDK 업데이트와 2026-05 API changelog, Codex remote/hook 문서가 하네스를 더 이상 "각 팀이 전부 직접 조립하는 루틴"으로만 보지 않게 만들었다. 동시에 gstack과 revfactory/harness의 최신 README는 외부 하네스를 그대로 복제하기보다 host adapter, team architecture, validation caveat까지 포함해 팀 맥락으로 가져와야 함을 보여준다.
- 2차 해석: Anthropic의 2026-03-25 auto mode와 2026-04-08 Managed Agents는 하네스를 평가 루프만이 아니라 durable session, stateless harness, sandbox/hands, credential boundary, permission classifier의 조합으로 보게 만든다. Anthropic의 2026-05-05 financial agents와 OpenAI의 2026-05-07 Developers plugin은 이 구조가 도메인 template과 provider plugin 형태로 배포 surface까지 내려가고 있음을 보여준다.
영향 챕터
index.mdxfoundations.mdxrepo-readable-systems.mdxengineering-mechanics.mdxcase-studies.mdxcase-openai.mdxcase-anthropic.mdxcase-gstack.mdxcase-revfactory.mdxdomain-playbooks.mdxteam-rollout.mdxchecklist.mdxoperations.mdxverification.mdxupdates.mdxapps/handbook/lib/books-data.ts
근거 링크
- https://openai.com/ko-KR/index/harness-engineering/
- https://openai.com/index/the-next-evolution-of-the-agents-sdk/
- https://openai.com/index/work-with-codex-from-anywhere/
- https://developers.openai.com/api/docs/changelog
- https://developers.openai.com/api/docs/guides/agents
- https://developers.openai.com/api/docs/guides/agents/sandboxes
- https://developers.openai.com/codex/hooks
- https://developers.openai.com/codex/remote-connections
- https://developers.openai.com/learn/developers-codex-plugin
- https://www.anthropic.com/engineering/harness-design-long-running-apps
- https://www.anthropic.com/engineering/claude-code-auto-mode
- https://code.claude.com/docs/en/permission-modes
- https://code.claude.com/docs/en/auto-mode-config
- https://www.anthropic.com/engineering/managed-agents
- https://platform.claude.com/docs/en/managed-agents/overview
- https://platform.claude.com/docs/en/managed-agents/mcp-connector
- https://www.anthropic.com/news/finance-agents
- https://toss.tech/article/harness-for-team-productivity
- https://github.com/garrytan/gstack
- https://github.com/revfactory/harness
2026-04-01
문서 구조 변경
하네스 엔지니어링신규 핸드북 초판 작성- 하네스의 정의를 프롬프트 기법이 아니라 작업 환경/평가/운영 설계로 정리
repo-readable-systems,evaluation-loops,team-rollout장 추가engineering-mechanics장 추가- 사례 허브에서 끝나지 않도록
case-openai,case-anthropic,case-toss,case-gstack,case-revfactory상세 페이지 추가 domain-playbooks,scenario-frontend-team,scenario-platform-team,scenario-payments-team,scenario-ai-product-team추가- OpenAI, Anthropic, Toss, gstack, revfactory/harness 사례 비교를 아코디언과 비교표로 확장
Files,Tabs,Steps,Mermaid기반 시각화 전면 보강- 팀이 바로 사용할 수 있는 체크리스트, 점수표, rollout 플랜, 운영 루틴 장 추가
engineering-mechanics와checklist에 최소 하네스 아키텍처, MVP 패키지, load-bearing vs ritual 판정 기준 보강verification.mdx추가- 기존 관련 책들에 역링크 추가
- handbook 책 생성을 위한
scaffold-book.mjs스크립트 추가 - handbook ESLint ignore에
.next-*생성 디렉터리 제외 규칙 추가
해석 변경
- 이전 해석: 범용 하네스는 시작점이고 결국 자기 하네스로 수렴한다.
- 새 해석: 자기 하네스로 수렴한다는 말의 핵심은 "개인 비법 축적"이 아니라, repo-readable 시스템, load-bearing 검증 루프, executable SSOT, domain layer, garbage collection을 팀 운영체계로 외재화하는 데 있다.
- 추가 해석: 하네스는 추상적 작업 방식이 아니라 입력 구조, 상태 외재화, 검증 인터페이스, 승인 경계, retry budget, cleanup 루틴을 설계하는 엔지니어링 레이어다.
- 추가 해석 2: 하네스는 회사 사례로만 이해하면 추상적일 수 있고, 프론트엔드/플랫폼/결제/AI 제품처럼 도메인별 실패 모드에 맞춘 플레이북으로 번역될 때 비로소 실제 도입 문서가 된다.
- 추가 해석 3: 좋은 하네스는 문서 수나 단계 수가 아니라,
없어졌을 때 다시 실패가 늘어나는 요소만 남기는 구조여야 하며, 최소 하네스 패키지와 과설계 경계를 함께 제시해야 실무 문서로 완결된다. - 변경 이유: 전달받은 다섯 자료를 함께 읽으면, 공통으로 반복되는 축이
repo/doc structure,planner/evaluator,workflow distribution,domain-specific validation,cleanup이라는 점이 더 명확하게 드러난다. 또한 사례를 비교만 하면 추상적으로 남기 쉬워, 실제 도입 장면과 기술 메커니즘을 사례별 페이지로 해부하는 편이 더 실무적이라고 판단했다.
영향 챕터
index.mdxfoundations.mdxrepo-readable-systems.mdxfive-elements.mdxengineering-mechanics.mdxevaluation-loops.mdxcase-studies.mdxcase-openai.mdxcase-anthropic.mdxcase-toss.mdxcase-gstack.mdxcase-revfactory.mdxdomain-playbooks.mdxscenario-frontend-team.mdxscenario-platform-team.mdxscenario-payments-team.mdxscenario-ai-product-team.mdxmake-it-yours.mdxteam-rollout.mdxchecklist.mdxoperations.mdxverification.mdxupdates.mdxapps/handbook/scripts/scaffold-book.mjspackages/eslint-config/base.js
근거 링크
- https://openai.com/ko-KR/index/harness-engineering/
- https://www.anthropic.com/engineering/harness-design-long-running-apps
- https://toss.tech/article/harness-for-team-productivity
- https://github.com/garrytan/gstack
- https://github.com/revfactory/harness
기록 템플릿
YYYY-MM-DD
문서 구조 변경
- ...
해석 변경
- 이전 해석:
- 새 해석:
- 변경 이유:
영향 챕터
...
근거 링크
- ...