telexed ~ c / b05ea88a-7c6radar:50 · agent_toolLIVE
← 피드로
NO.
#b05ea88a
분야
에이전트·도구
출처
Anthropic Engineering
게재
2026-05-05 06:20:21
중요도
★ 5/10 — radar 50
`Claude Code` 품질 저하, 모델이 아니라 제품 레이어 3곳이 원인이었다
FIG-0051:1

`Claude Code` 품질 저하, 모델이 아니라 제품 레이어 3곳이 원인이었다

`Claude Code` quality regressions traced to 3 product-layer changes

문제는 모델 성능 하락이 아니라 기본 추론 강도, 세션 메모리 처리 버그, 간결화용 시스템 프롬프트였다. v2.1.116에서 모두 복구됐고, 에이전트 품질은 모델보다 제품 레이어 변경이 더 크게 흔들 수 있다는 경고다.

[ 요점 ]
  1. 3월 4일 기본 reasoning effort를 high에서 medium으로 낮췄다가 4월 7일 되돌렸다. 지연은 줄었지만 코딩 품질 희생이 더 컸다.
  2. 3월 26일 이후 1시간 넘게 쉬었던 세션의 오래된 thinking을 한 번만 지워야 했는데, 매 턴 반복 삭제되는 버그가 생겨 맥락 유지가 무너졌다.
  3. 4월 16일 넣은 '덜 장황하게 답하라' 시스템 프롬프트가 다른 프롬프트 변경과 겹치며 코딩 성능을 깎았다. 4월 20일 롤백됐다.
  4. 영향 범위는 API가 아니라 Claude Code, Claude Agent SDK, Claude Cowork였다. 같은 모델도 래퍼와 세션 관리에 따라 체감 품질이 크게 달라진다.
  5. 구독자 사용량 한도를 4월 23일 리셋했다. 도구 선택보다 버전 고정, 기본값 변경 감시, 세션 회귀 테스트가 더 중요해졌다.
원문www.anthropic.com/engineering/april-23-postmortem원문 보기 →

// related