에이전트 가치 지표
AI 에이전트 가치를 측정하는 관점을 Salesforce AWU, outcome pricing, Copilot Credits, ServiceNow framework로 비교합니다.
AI 에이전트의 가치는 토큰 수로만 설명되지 않습니다. 토큰은 모델이 처리한 원가와 활동량을 보여주지만, 고객 케이스가 해결됐는지, 영업 리드가 검증됐는지, 내부 업무 시간이 줄었는지까지 설명하지는 못합니다.
이 핸드북은 주요 벤더들이 제안하는 지표와 과금 단위를 비교해, 조직이 자신에게 맞는 측정 관점을 고를 수 있도록 돕습니다. 특정 회사의 지표가 정답이라는 결론을 내기보다, 각 회사가 무엇을 가치로 정의하고 무엇을 단순화하는지 읽는 데 초점을 둡니다.
기준일
공식 자료와 공개 보도는 2026년 6월 27일 기준으로 확인했습니다. AI 에이전트 가격과 사용량 단위는 빠르게 바뀌므로 실제 도입 판단, 계약, 갱신 논의 전에는 각 벤더의 최신 약관과 가격표를 다시 확인해야 합니다.
핵심 관점
| 질문 | 토큰 중심 답 | 가치 지표 중심 답 |
|---|---|---|
| AI를 많이 썼는가 | 처리 토큰, 호출 수 | 실제 업무 완료, 자동 해결, 시간 절감 |
| 비용을 예측할 수 있는가 | 모델 단가와 사용량 | 업무 단위당 비용, 결과당 비용 |
| 고객이 납득하는가 | 내부 원가 설명 | 고객이 얻은 결과 설명 |
| 개선 방향이 보이는가 | 더 싸게, 더 적게 | 더 정확하게, 더 많이 완료 |
목차
Ch1. Tokenmaxxing의 한계
토큰 사용량이 왜 AI 가치의 좋은 대리 지표가 되기 어려운지 정리합니다.
Ch2. 지표 분류법
사용량, 업무, 결과, 경제성, 신뢰 지표를 하나의 언어로 구분합니다.
Ch3. 벤더 지도
Salesforce, Intercom, Zendesk, HubSpot, Microsoft, ServiceNow의 관점을 한 표로 비교합니다.
Ch4. 벤더별 상세 프로필
각 벤더의 제품 범위, 가격 단위, 판정 방식, 해석상의 쟁점을 정리합니다.
Ch5. Salesforce AWU
Agentic Work Unit이 토큰을 업무량 지표로 재해석하는 방식을 봅니다.
Ch6. Support Outcome Pricing
Intercom, Zendesk, HubSpot이 고객지원과 세일즈 결과를 어떻게 과금 단위로 바꾸는지 비교합니다.
Ch7. Credit & Productivity Models
Microsoft Copilot Credits와 ServiceNow의 AI value framework를 비교합니다.
Ch8. 가치 측정의 이론
AI 에이전트 지표를 회계 단위, 대리 지표, 결과 지표, 가치 분배 관점에서 분석합니다.
Ch9. 지표의 정치경제학
벤더와 고객 사이에서 지표가 비용, 위험, 권한을 어떻게 재배분하는지 봅니다.
Ch10. 비교 해석
벤더별 지표를 추상화 수준, 증거 강도, 인센티브 구조로 비교합니다.
먼저 읽을 결론
| 지표 유형 | 잘 설명하는 것 | 놓치기 쉬운 것 |
|---|---|---|
| Tokens | 모델 사용량, 원가, 인프라 규모 | 업무 완료, 고객 가치, 품질 |
| Credits | 예산 통제, 제품군 전체 사용량 | 실제 결과와의 거리 |
| Actions | 에이전트가 수행한 작업량 | 결과 성공 여부 |
| Resolutions | 고객지원 자동화 성과 | 문제 난이도, 고객 만족 |
| Outcomes | 결과 기반 과금 명분 | 벤더가 정의한 결과의 품질 |
| Business KPI | 매출, 비용, 시간, 리스크 | AI 단독 기여도 분리 |
좋은 측정 체계는 하나의 숫자를 고르는 일이 아닙니다. 토큰, 비용, 업무량, 결과, 품질, 고객 경험을 묶어 조직의 의사결정에 맞는 지표 포트폴리오를 설계하는 일입니다.
참고 핸드북
- SaaS 유료 플랜 설계: AI SaaS 가격 모델과 가치 지표 설계
- AI 시대의 GTM: AI 가격, 가치 증명, RevOps 지표 운영
- LLMOps AgentOps: 프로덕션 에이전트 관측과 운영 지표