지표의 정치경제학
AI 에이전트 지표가 벤더와 고객 사이의 위험, 비용, 권한을 어떻게 재배분하는지 분석합니다.
핵심 요약
- AI 에이전트 지표는 중립적인 숫자가 아니라 벤더와 고객 사이의 위험 배분 장치입니다.
- 토큰 기반 과금은 원가 리스크를 고객에게 넘기고, outcome pricing은 성과 리스크 일부를 벤더가 떠안는 구조입니다.
- Credit 모델은 복잡한 기술 단위를 구매 가능한 예산 단위로 바꾸지만, 실제 가치와의 거리를 숨길 수 있습니다.
- 지표를 분석할 때는 “정확한가”뿐 아니라 “누가 이 지표로 이익을 얻는가”를 함께 봐야 합니다.
지표는 단순히 현실을 묘사하지 않습니다. 지표는 시장을 만듭니다. 어떤 단위로 가격을 매기느냐에 따라 고객은 다른 방식으로 구매하고, 벤더는 다른 방식으로 제품을 설계하며, 내부 운영팀은 다른 방식으로 성공을 보고합니다.
AI 에이전트 시장에서 지표 논쟁이 중요한 이유는 비용 구조가 기존 SaaS와 다르기 때문입니다. 전통 SaaS는 좌석을 팔고 사용량이 늘어도 한계비용이 낮은 경우가 많았습니다. AI 에이전트는 사용할수록 inference, tool execution, retrieval, evaluation 비용이 발생합니다. 그래서 벤더는 원가를 통제하면서도 고객에게는 가치 기반 이야기를 해야 합니다.
과금 단위는 위험 배분이다
과금 단위는 누가 어떤 위험을 떠안는지를 결정합니다.
| 과금 단위 | 고객이 떠안는 위험 | 벤더가 떠안는 위험 |
|---|---|---|
| Seat | 실제 사용하지 않아도 비용 발생 | heavy user의 원가 부담 |
| Token | 사용량 증가와 프롬프트 비효율 비용 | 고객이 결과를 못 얻어도 매출 발생 |
| Credit | 환산 구조를 이해하기 어려움 | credit burn이 불신을 만들 수 있음 |
| Action | 작업이 쪼개질수록 비용 증가 | action당 원가 최적화 압박 |
| Conversation | 복잡한 대화도 같은 단가일 수 있음 | 고난도 대화 원가 부담 |
| Resolution | 해결 판정 품질에 의존 | 실패한 시도에는 과금 어려움 |
| Outcome | outcome 정의가 벤더에 의존 | 성과 미달 시 매출 방어 어려움 |
이 관점에서 Intercom과 Zendesk의 outcome/resolution pricing은 고객에게 “성과가 없으면 비용도 없다”는 안심을 줍니다. 하지만 outcome 판정 기준이 벤더 시스템 안에 있으면, 성과 리스크가 완전히 벤더에게 넘어간 것은 아닙니다. 고객은 여전히 판정의 해석 리스크를 가집니다.
이 이동은 단순히 가격표가 정교해지는 과정이 아닙니다. 왼쪽에서는 고객이 사용량과 프롬프트 비효율의 위험을 더 많이 떠안고, 오른쪽에서는 벤더가 성과 미달 위험을 더 많이 떠안습니다. 다만 오른쪽으로 갈수록 성공 판정 권한을 둘러싼 논쟁이 커집니다.
벤더가 원하는 지표
벤더는 세 가지 조건을 동시에 만족하는 지표를 원합니다.
| 조건 | 이유 |
|---|---|
| 가치처럼 들려야 함 | 고객 예산을 정당화해야 함 |
| 원가와 연결돼야 함 | inference와 tool 비용을 회수해야 함 |
| 확장 가능해야 함 | use case가 늘어도 같은 가격 체계로 팔 수 있어야 함 |
Salesforce Flex Credits는 이 조건을 잘 보여줍니다. action 기반이므로 원가와 어느 정도 연결되고, 여러 use case에 확장 가능하며, “business value your AI agents create”라는 가치 언어로 설명됩니다. 그러나 고객 입장에서는 action이 실제 가치와 얼마나 가까운지 따로 해석해야 합니다.
Microsoft Copilot Credits도 비슷합니다. feature별 rate table은 매우 투명해 보이지만, 투명한 것은 사용량 회계이지 비즈니스 가치가 아닙니다. 이 모델은 “얼마나 썼는가”를 잘 설명하지만 “무엇이 좋아졌는가”는 별도 지표가 필요합니다.
고객이 원하는 지표
고객은 원칙적으로 결과 기반 지표를 원합니다. 하지만 모든 결과 기반 지표가 고객에게 유리한 것은 아닙니다.
| 고객이 원하는 것 | 실제 난점 |
|---|---|
| 해결된 건에만 지불 | 해결 판정의 기준이 필요 |
| qualified lead에만 지불 | qualification과 revenue의 거리 |
| 절감된 시간만큼 지불 | 절감 시간이 실제 비용 절감인지 불명확 |
| 자동화된 workflow만큼 지불 | workflow 난이도와 예외 처리 차이 |
결과 기반 과금은 “고객에게 유리한 가격 모델”처럼 보이지만, 결과의 정의가 너무 낮은 수준에 있으면 activity pricing과 크게 다르지 않습니다. 예를 들어 recommended lead는 outcome처럼 보이지만, closed deal이나 accepted opportunity와는 거리가 있습니다. contained resolution은 자동화 성과처럼 보이지만, 고객 만족이 빠질 수 있습니다.
지표가 제품을 바꾼다
어떤 지표를 전면에 두느냐는 제품 설계에도 영향을 줍니다.
| 전면 지표 | 제품이 향하는 방향 |
|---|---|
| Token | 압축, 캐싱, 모델 라우팅, 짧은 응답 |
| Credit | 기능별 rate card, admin control, quota 관리 |
| Action | tool orchestration, action catalog, reusable workflow |
| Resolution | support QA, escalation detection, deflection tuning |
| Outcome | workflow completion, routing, CRM state change |
| Time saved | productivity analytics, baseline modeling |
Zendesk가 verified resolution을 강조하면 제품은 LLM verification과 72시간 follow-up window를 중심으로 발전합니다. HubSpot이 CRM 기반 outcome을 강조하면 제품은 Smart CRM context, lead routing, outreach recommendation 쪽으로 강화됩니다. ServiceNow가 productivity time value를 강조하면 제품은 workflow analytics와 persona별 value model을 강화합니다.
지표는 사후 보고가 아니라 제품 로드맵의 방향타입니다.
지표의 권력
지표는 조직 안에서 권한을 재배분합니다. CFO는 예산 예측 가능한 credit 모델을 선호할 수 있습니다. CX 리더는 resolution과 CSAT를 원합니다. 플랫폼 팀은 tokens, latency, model routing을 봅니다. 벤더는 이 다양한 내부 이해관계를 하나의 구매 언어로 묶으려 합니다.
| 이해관계자 | 선호하는 지표 | 이유 |
|---|---|---|
| CFO | cost per outcome, credits, cap | 예산 통제 |
| COO | time saved, requests avoided | 운영 효율 |
| CX leader | verified resolution, CSAT | 고객 경험 |
| RevOps | accepted lead, pipeline movement | 매출 연결 |
| Platform team | tokens, latency, error rate | 시스템 운영 |
| Vendor | scalable unit, attachable SKU | 매출 확장 |
따라서 “좋은 AI 에이전트 지표”는 객관적으로 하나만 존재하지 않습니다. 지표는 조직 내 협상의 언어입니다. 어떤 지표를 채택하느냐는 어떤 부서의 관점을 우선시하느냐와 연결됩니다.
분석의 핵심
벤더 지표를 읽을 때 가장 중요한 질문은 “이 숫자가 진짜인가”가 아닙니다. 더 중요한 질문은 “이 숫자가 어떤 관계를 만든는가”입니다.
| 분석 축 | 질문 |
|---|---|
| 위험 | 실패 비용은 누가 부담하는가 |
| 권한 | 성공 판정은 누가 하는가 |
| 가시성 | 어떤 비용과 실패가 보이는가 |
| 인센티브 | 이 지표가 커질수록 어떤 행동이 늘어나는가 |
| 전환 | 사용량이 어떻게 매출, 비용, 시간으로 번역되는가 |
이런 의미에서 AI 에이전트 가치 지표는 가격표의 문제가 아닙니다. 소프트웨어가 노동, 자동화, 성과, 비용을 어떻게 다시 정의하는지에 관한 정치경제학입니다.