telexed ~ c / 08a7f8aa-dedradar:50 · otherLIVE
← 피드로
NO.
#08a7f8aa
분야
기타
출처
Simon Willison
게재
2026-04-24 01:31:25
중요도
★ 5/10 — radar 50

Claude Code 품질 이슈의 핵심은 모델이 아니라 하니스 버그였다

Claude Code quality issues were caused by harness bugs, not model regressions

최근 두 달간 Claude Code 품질이 떨어졌다는 불만은 실제 문제에 기반한 것이었고, 원인은 모델 성능 저하가 아니라 하니스 계층의 세 가지 버그였다는 내용입니다. 인디 개발자 관점에서는 에이전트 품질 문제가 모델 자체보다 세션 관리, 컨텍스트 유지, 실행 흐름 같은 주변 시스템에서 더 크게 발생할 수 있다는 점이 핵심입니다.

[ 요점 ]
  1. Anthropic의 사후 분석에 따르면 Claude Code 품질 저하의 직접 원인은 모델이 아니라 하니스의 세 가지 문제였습니다.
  2. 특히 3월 26일 변경에서 1시간 이상 비활성 세션의 오래된 사고 흔적을 한 번만 지워야 했는데, 버그로 인해 이후 매 턴 반복 삭제되어 모델이 잘 잊고 반복하는 것처럼 보였습니다.
  3. 인디 개발자가 에이전트형 제품을 만들 때는 모델 평가만 볼 것이 아니라 세션 수명주기, 컨텍스트 보존, 하니스 관측성까지 함께 점검해야 합니다.
원문simonwillison.net/2026/Apr/24/recent-claude-code-quality-reports/#atom-everything원문 보기 →

// related