telexed ~ c / c7df03c2-d4fradar:50 · agent_toolLIVE
← 피드로
NO.
#c7df03c2
분야
에이전트·도구
출처
r/ClaudeAI
게재
2026-05-04 11:12:10
중요도
★ 5/10 — radar 50

`Claude` 벌크 작업, 저가 사이드 모델로 분리해 비용 절감

Route Claude's Mechanical Work to a Cheap Side Model

비용을 태우는 건 추론이 아니라 포맷팅·추출·분류 같은 잡일이었다. CLAUDE.md에 금지 목록을 걸고 저가 모델로 넘기니 217건에 $0.41로 정리됐고, 검수 전제 워크플로라면 바로 적용할 만하다.

[ 요점 ]
  1. 최근 3주 동안 기계적 작업 217건을 오프로딩했고 총비용은 $0.41였다. 같은 양을 Sonnet에 맡기면 대략 $7 수준.
  2. 라우팅 규칙은 허용 목록보다 금지 목록이 잘 먹혔다. CLAUDE.md에 JSON 포맷팅, 필드 추출, 파일 분류, 훑어볼 요약은 Claude가 하지 말라고 박는 방식.
  3. 구조는 에이전트가 아니라 감독형 워커다. 툴 호출, 파일 접근, 체인 실행 없이 텍스트만 처리하고 결과는 사람이 검수한다.
  4. 기본 모델은 DeepSeek V4 Flash이고 1M 컨텍스트를 내세운다. 엔드포인트 한 줄만 바꾸면 ollama, vllm, LM Studio로도 대체 가능.
원문www.reddit.com/r/ClaudeAI/comments/1t3elab/most_of_my_claude_usage_was_on_work_that_didnt/원문 보기 →

// related