telexed ~ c / bc689d3c-199radar:50 · infra_saasLIVE
← 피드로
NO.
#bc689d3c
분야
인프라·SaaS
출처
vercel_blog
게재
2026-05-12 04:00:00
중요도
★ 5/10 — radar 50
`AI Gateway` 프로덕션 인덱스, 돈은 `Anthropic`으로 가고 트래픽은 `Google`로 간다
FIG-0061:1

`AI Gateway` 프로덕션 인덱스, 돈은 `Anthropic`으로 가고 트래픽은 `Google`로 간다

`AI Gateway` production index: spend goes to `Anthropic`, volume to `Google`

실서비스에선 승자가 하나로 정리되지 않는다. 고위험 추론은 Claude에 돈이 몰리고 대량 저가 호출은 Gemini Flash가 먹어, 단일 모델 고정 전략이 빠르게 비싸졌다.

[ 요점 ]
  1. 2026년 4월 지출 기준 점유율은 `Anthropic` 61%, Google 21%, OpenAI 12%였다. 비용은 품질이 필요한 호출에서 터진다.
  2. 토큰 볼륨 기준 순위는 뒤집혔다. `Google` 38%, Anthropic 26%, OpenAI 13%, xAI 10%로 저가 모델이 대량 요청을 흡수했다.
  3. 같은 고객 안에서도 고급 추론은 Claude Opus, 싼 대량 호출은 Gemini Flash로 갈린다. 이제 기본 설계는 멀티모델 라우팅이다.
  4. B2B는 토큰당 비용이 B2C약 2배다. 오답 비용이 큰 백오피스 업무에선 싼 모델로 아끼는 돈보다 사고 비용이 더 크다.
  5. Anthropic은 백오피스 토큰 점유율이 71%였지만 컨슈머에선 7%까지 떨어졌다. 반대로 Google은 컨슈머에서 Gemini Flash 하나로 밀어붙였다.
원문vercel.com/blog/ai-gateway-production-index원문 보기 →

// related