telexed ~ cat / model_api★4 이상 · 매시 갱신 · UTC+09LIVE
전체 모델·API

모델·API

28
오늘2 dispatches
  • #0028모델·APIGeekNews

    `Qwen3.7-Max`, 에이전트 실행 겨냥한 독점 모델

    `Qwen3.7-Max`: Agent-First Proprietary Model
    70radar
    Qwen3.7-Max독점 LLM — 장시간 에이전트 실행 겨냥

    코딩·디버깅부터 사무 자동화, 장시간 자율 실행까지 한 모델로 밀고 있다. 벤치 숫자는 강하지만, 실제 채택은 API 접근성과 비용이 갈라놓음.

    • 목표 범위가 코딩, 디버깅, 사무 자동화, 수백~수천 단계 자율 실행까지 넓다. 단순 챗봇보다 에이전트 런타임에 가깝다.
    • Terminal Bench 2.0-Terminus 69.7점, GPQA Diamond 92.4점을 제시했다. 코딩·추론 평가에서 비교 테스트할 만한 숫자다.
    • 35시간 자율 실행은 장기 작업 자동화 신호로 크다. 다만 실제 가치는 툴 호출 안정성, 실패 복구, 가격에서 결정된다.
    출처: news.hada.io/topic?id=29716원문 보기 →
  • #0027모델·APIr/LocalLLaMA

    Cohere, Apache 2.0 오픈웨이트 MoE `Command A+` 공개

    Cohere launches `Command A+`, an Apache 2.0 MoE open-weight model
    80radar
    Command A+오픈웨이트 LLM — Apache 2.0 MoE 모델

    실사용 에이전트 백엔드용 오픈웨이트 선택지가 하나 늘었다. Apache 2.01-2 GPU 구동 조합이라 자체 호스팅 실험 비용을 낮춰볼 만함.

    • Command A+는 Cohere의 첫 MoE 모델. 최상위 성능보다 속도와 응답성을 앞세운 포지셔닝이다.
    • 라이선스는 Apache 2.0. 상업 제품에 붙일 때 연구용·비상업 제한 리스크가 작다.
    • 양자화 작업을 강조했고 1-2 GPU에서도 잘 돈다고 못박았다. 로컬 에이전트 서버 실험에 직접적인 비용 절감 신호.
    • Cohere는 엔터프라이즈 에이전트에 쓰는 방향의 모델이라고 설명했다. 벤치마크 장난감보다 제품 내장용에 가깝다.
    출처: www.reddit.com/r/LocalLLaMA/comments/1tizmar/re_what_eve원문 보기 →
어제10 dispatches
  • #0026모델·APIr/LocalLLaMA

    `Qwen3.7 Max`, Artificial Analysis 5위 기록…27B/35B는 대기

    `Qwen3.7 Max` hits 5th on Artificial Analysis; 27B/35B still pending
    60radar
    Qwen3.7 Max대형 언어 모델 — Alibaba Qwen 계열 고성능 버전

    Artificial Analysis 기준 상위권에 올라 GPT 5.4 xhigh와 거의 같은 라인, Gemini 3.5 Flash보다 한 단계 위다. 벤치마크 신호는 강하지만 API 가격·소형 모델 결과 전까지 교체 판단은 이르다.

    • Artificial Analysis에서 5위. GPT 5.4 xhigh와 거의 동급이라 모델 평가 후보에 넣을 만한 수치다.
    • Gemini 3.5 Flash보다 한 단계 위로 언급됨. 실제 선택은 지연시간·가격까지 봐야 갈린다.
    • Qwen3.6 27B는 Max보다 6점 낮음. 27B/35B Qwen3.7 결과가 로컬·저비용 배포 판단의 핵심 변수다.
    출처: www.reddit.com/r/LocalLLaMA/comments/1tie6gy/qwen37_max_원문 보기 →
  • #0025모델·APIvercel_blog

    `Grok Build 0.1`, `Vercel AI Gateway`에서 호출 가능

    `Grok Build 0.1` lands on `Vercel AI Gateway`
    60radar
    Grok Build 0.1에이전트형 코딩 모델 — Grok Build CLI 구동 모델

    AI SDK에서 바로 붙일 수 있는 에이전트형 코딩 모델 선택지가 하나 늘었다. 다만 초기 베타라 추론 제어가 막혀 있어 실험용으로 먼저 보는 게 맞음.

    • 모델명은 xai/grok-build-0.1. 이미 AI Gateway를 쓰는 앱이면 라우팅 변경만으로 테스트 진입 가능.
    • 추론 강도는 설정 불가, 비추론 모드도 없음. 비용·지연시간을 세밀하게 조절해야 하는 에이전트에는 부담.
    • 게이트웨이 레이어에서 사용량·비용 추적, 재시도, 장애 전환, BYOK, 지능형 라우팅을 같이 얹을 수 있다.
    출처: vercel.com/changelog/grok-build-0-1-now-available-on-ver원문 보기 →
  • `llm-gemini` `0.32`, `gemini-3.5-flash` 지원 추가

    `llm-gemini` `0.32` adds `gemini-3.5-flash`
    50radar
    llm-geminiLLM CLI 플러그인 — Gemini 모델을 `llm`에서 호출

    Simon Willison의 llm CLI에서 Google의 새 Flash 모델을 바로 호출할 수 있게 됐다. 이미 llm 기반 스크립트를 쓰고 있다면 테스트 비용이 낮아짐.

    • llm-geminigemini-3.5-flash 모델명을 추가했다. 기존 llm CLI 워크플로우에서 별도 래퍼 없이 바로 비교 가능.
    • 변경 범위는 모델 alias 1개 추가에 가깝다. 새 제품 기능보다는 자동화 파이프라인에 붙이는 작은 배관 업데이트.
    • 요약, 추출, 콘텐츠 생성처럼 모델 교체 실험이 잦은 작업에 적합. llm 생태계를 안 쓰면 당장 영향은 제한적.
    출처: simonwillison.net/2026/May/19/llm-gemini-2/#atom-everyth원문 보기 →
  • `Gemini 3.5 Flash`, 가격 3~6배 올리고 전면 배포

    `Gemini 3.5 Flash` ships broadly with a 3-6x price jump
    90radar

    무료 제품까지 새 모델로 깔았지만 API 단가는 입력 $1.50/M·출력 $9/M까지 올라갔다. 대량 출력형 기능은 비용 재계산이 먼저.

    • 모델 ID는 gemini-3.5-flash; 1,048,576 입력 토큰과 65,536 출력 토큰 지원. 긴 문서 처리에는 강함.
    • 가격은 3 Flash Preview3배, 3.1 Flash-Lite6배. Flash 계열을 싼 기본값으로 두기 어려워졌다.
    • Interactions API 베타는 서버 측 히스토리 관리가 핵심. 에이전트 백엔드에서 대화 상태 처리 코드가 줄어든다.
    • 이번 릴리스에는 computer use가 없다. 브라우저·데스크톱 제어 워크플로우라면 모델 교체만으로는 부족함.
    • 3.5 Pro는 다음 달 예고. 더 비쌀 가능성이 높아 모델 라우팅과 출력 토큰 상한을 먼저 잡아야 한다.
    출처: simonwillison.net/2026/May/19/gemini-35-flash/#atom-ever원문 보기 →
  • `Gemini 3.5 Flash`, 장기 에이전트·코딩 작업 겨냥

    `Gemini 3.5 Flash` targets long-running agents and coding
    100radar

    속도형 라인에서 장기 에이전트·코딩 작업을 정면으로 겨냥했다. Gemini 기반 자동화 파이프라인은 품질/지연시간 기준을 다시 잡을 만함.

    • Gemini 3.5 모델로 프런티어급 지능과 실행 능력을 결합. 장기 에이전트·코딩 작업이 핵심 타깃이다.
    • Flash 시리즈의 속도 포지션을 유지해, Pro급 지연시간이 부담이던 자동화 흐름에 바로 후보로 들어간다.
    • Terminal-Bench 2.1 76.2%, GDPval-AA 1656 Elo로 제시됐고 Gemini 3.1 Pro를 앞섰다.
    출처: news.hada.io/topic?id=29670원문 보기 →
  • #0021모델·APIGoogle AI

    `Google AI`, **$100**짜리 `AI Ultra` 구독 플랜 추가

    Google adds `$100 AI Ultra` tier to `Google AI` subscriptions
    60radar

    유료 AI 접근권이 Plus·Pro를 넘어 고가 티어로 더 쪼개진다. API 가격 변화는 아니지만, 고급 기능이 구독 뒤로 이동하는 신호라 비용 대비 애매.

    • AI Ultra 가격은 $100. 포함 모델·쿼터가 기존 Pro보다 확실히 높지 않으면 개인 작업용으론 부담 크다.
    • Google AI Plus, Pro, Ultra 전반에 새 기능과 혜택이 붙지만, 본문만으로는 구체 쿼터·모델명이 없다.
    • API 과금 발표가 아니라 구독 상품 개편이다. 앱 백엔드 비용보다 리서치·콘텐츠 제작 워크플로우 영향이 먼저다.
    출처: blog.google/products-and-platforms/products/google-one/g원문 보기 →
  • #0020모델·APIGoogle AI

    구글, 액션 지향 프런티어 모델 라인 `Gemini 3.5` 공개

    `Gemini 3.5` released as Google’s action-oriented frontier model line
    100radar

    구글은 새 모델 라인을 채팅보다 행동 실행 쪽에 걸고 있다. 가격·API·성능 수치가 빠져 당장 이전 판단은 어렵지만, 모델 로드맵 신호로는 바로 추적 대상.

    • 공식 구글 채널에서 Google I/O 공개와 최신 모델 시리즈 출시를 확인했다. 2차 반응글이 아니라 1차 발표다.
    • 포지셔닝은 frontier intelligence with action 하나로 압축된다. 에이전트형 워크플로우와 도구 호출 경쟁을 겨냥한다.
    • 가격, 컨텍스트 길이, 벤치마크, API 마이그레이션 정보는 제공되지 않았다. 스택 교체는 상세 문서 확인 후가 맞다.
    출처: blog.google/innovation-and-ai/models-and-research/gemini원문 보기 →
  • `Gemini 3.5 Flash` 모델 문서 등장

    `Gemini 3.5 Flash` Model Page Appears
    70radar

    공식 개발자 문서 링크만 있고 가격·컨텍스트·벤치마크는 아직 비교할 수 없다. 새 Flash 계열 후보라 API 비용표 확인 전까지는 대기.

    • URL이 ai.google.dev 모델 문서로 이어진다. 반응글이 아니라 1차 출처 신호라 추적 가치는 높다.
    • 가격, 레이트 리밋, 컨텍스트 길이, 벤치마크 수치가 없다. 지금은 비용 대비 교체 판단이 불가능.
    • Gemini 3.5 Flash는 API 후보군에 올려둘 만하다. SDK·가격표가 열리면 기존 추론 라우팅과 비교하면 됨.
    출처: blog.google/innovation-and-ai/models-and-research/gemini원문 보기 →
  • `anthropic-sdk-python` `0.103.1`, `SessionToolRunner` 소유권 버그 수정

    `anthropic-sdk-python` `0.103.1` fixes `SessionToolRunner` ownership handling
    40radar
    anthropic-sdk-pythonPython SDK — Anthropic API 공식 클라이언트

    에이전트 런타임에서 SessionToolRunner가 자기 소유가 아닌 툴 호출을 건너뛰도록 고쳤다. SDK 기반 툴 세션을 쓰면 올릴 만하고, 일반 호출만 쓰면 급하지 않음.

    • SessionToolRunner가 소유하지 않은 tool call을 skip하도록 수정 — 여러 runner가 섞인 세션에서 오작동 여지를 줄임.
    • 변경점은 버그 수정 1건뿐. 모델, 가격, API 표면, 메시지 호출 방식 변화는 공개되지 않았다.
    • anthropic-sdk-python을 pinning 중이면 에이전트 툴 실행 테스트 후 업데이트. 단순 API 래퍼라면 우선순위 낮음.
    출처: github.com/anthropics/anthropic-sdk-python/releases/tag/원문 보기 →
  • `Anthropic TypeScript SDK` `v0.97.1`, `SessionToolRunner` 소유권 버그 수정

    `Anthropic TypeScript SDK` `v0.97.1` Fixes `SessionToolRunner` Tool-Call Ownership
    40radar
    Anthropic TypeScript SDKLLM API SDK — TypeScript에서 Anthropic API 호출

    러너가 자기 소유가 아닌 tool call을 건드리지 않도록 막은 좁은 패치다. SessionToolRunner 기반 에이전트 루프를 쓰는 경우만 업데이트 우선순위 있음.

    • 릴리스일은 2026-05-19. sdk-v0.97.0에서 sdk-v0.97.1로 올라간 패치 버전이며 모델·가격 변경은 없다.
    • 수정 항목은 runner: skip tool calls SessionToolRunner does not own 하나. 세션 기반 tool call 분기에서만 직접 영향이 난다.
    • 새 API나 기능 추가는 언급되지 않았다. SessionToolRunner를 안 쓰면 당장 올릴 이유는 약함.
    출처: github.com/anthropics/anthropic-sdk-typescript/releases/원문 보기 →
5월 19일 (화)5 dispatches
  • `bedrock-sdk` `v0.29.2`, 서브패키지 CI 빌드 오류 수정

    `bedrock-sdk` `v0.29.2` fixes sub-package CI builds
    40radar
    Anthropic Bedrock SDKTypeScript SDK — Anthropic 모델을 AWS Bedrock에서 호출

    CI에서 @types/node 버전 불일치로 깨지던 서브패키지 빌드가 정리됐다. 기능 추가는 없지만 AWS Bedrock 연동 프로젝트라면 의존성 업데이트만 해도 충분함.

    • @types/node를 서브패키지 간 정렬해 TypeScript SDK의 CI 빌드 실패 원인 하나를 제거했다.
    • 변경 내역은 버그 수정뿐. Anthropic 모델, API 표면, 가격에는 새로 반영된 변화가 없다.
    • bedrock-sdk를 엄격한 CI에서 쓰는 프로젝트는 업데이트 가치 있음. 그 외에는 정기 유지보수에 가깝다.
    출처: github.com/anthropics/anthropic-sdk-typescript/releases/원문 보기 →
  • `vertex-sdk` `v0.16.1`, TypeScript CI 빌드 오류 수정

    `vertex-sdk` `v0.16.1` fixes TypeScript CI build issue
    40radar
    vertex-sdkAnthropic TypeScript SDK — Vertex AI 연동용 패키지

    @types/node 버전을 서브패키지에 맞춰 CI 빌드 깨짐을 고쳤다. 모델·API 변화는 없고, 해당 오류를 겪는 프로젝트만 바로 올리면 됨.

    • 수정 범위는 서브패키지의 @types/node 정렬 하나. 타입 버전 불일치로 깨지던 CI 빌드를 겨냥했다.
    • 릴리스 날짜는 2026-05-19. vertex-sdk-v0.16.0에서 v0.16.1로 가는 패치 업데이트다.
    • 가격·모델·런타임 변경은 언급되지 않았다. 빌드가 정상이라면 긴급 업그레이드 가치는 낮음.
    출처: github.com/anthropics/anthropic-sdk-typescript/releases/원문 보기 →
  • `anthropic-sdk-typescript` `0.97.0`, 자체 호스팅 샌드박스 헬퍼 추가

    `anthropic-sdk-typescript` `0.97.0` adds self-hosted sandbox helpers
    50radar
    anthropic-sdk-typescriptTypeScript SDK — Anthropic API 클라이언트 패키지

    CMA에서 자체 호스팅 샌드박스를 다루는 헬퍼가 추가됐다. 에이전트 실행 환경을 직접 통제하는 API 앱에는 작지만 바로 손댈 만한 업데이트.

    • clientCMA self-hosted sandbox 지원이 들어갔다. 샌드박스 인프라를 직접 붙이는 구현 부담이 줄어듦.
    • tsc-multi 업그레이드로 Node 26 호환 문제가 수정됐다. 최신 런타임 CI에서 TypeScript 빌드 리스크 감소.
    • 테스트 쪽 중복 File import 제거는 정리성 변경. 런타임 영향은 샌드박스 헬퍼 추가에 집중됨.
    출처: github.com/anthropics/anthropic-sdk-typescript/releases/원문 보기 →
  • `anthropic-sdk-python` `v0.103.0`, CMA 자체 호스팅 샌드박스 지원

    `anthropic-sdk-python` `v0.103.0` adds CMA self-hosted sandbox support
    40radar
    anthropic-sdk-pythonPython SDK — Anthropic API 공식 클라이언트

    CMA에서 자체 호스팅 샌드박스를 SDK 헬퍼로 붙일 수 있게 됐다. 실행 환경 통제가 필요한 API 워크플로우엔 작지만 바로 체감되는 업데이트.

    • 공개일은 2026-05-19. 릴리스 노트상 기능 추가는 client의 CMA 샌드박스 헬퍼 1건뿐이다.
    • self-hosted sandboxes 지원으로 Anthropic API 실행 환경을 외부 관리형 샌드박스에만 묶지 않아도 됨.
    • 가격·모델·마이그레이션 변경은 없다. CMA나 샌드박스 실행 경로를 이미 쓰는 경우에만 확인하면 충분.
    출처: github.com/anthropics/anthropic-sdk-python/releases/tag/원문 보기 →
  • `Gemini 3.5 Flash`, `Vercel AI Gateway` 지원 시작

    `Gemini 3.5 Flash` lands on `Vercel AI Gateway`
    80radar
    Vercel AI GatewayLLM API 게이트웨이 — 라우팅·비용 추적·failover 제공

    코딩 성능, 병렬 에이전트 루프, 멀티턴 일관성이 개선된 Flash 계열을 게이트웨이로 바로 호출할 수 있다. 장애 대응과 비용 추적까지 묶어 쓰면 지금 써볼 만함.

    • AI SDK에서 모델을 google/gemini-3.5-flash로 지정하면 된다. 기존 Gateway 사용자는 교체 비용이 낮다.
    • 기본 thinking level은 medium. 품질과 속도·비용을 맞추는 설정이라 대량 호출 앱에 더 현실적이다.
    • temperature, topP, topK, thinking_budget 미지원. 샘플링 제어에 기대는 기능은 회귀 테스트가 필요하다.
    • AI Gateway는 사용량·비용 추적, retries, failover, BYOK, provider routing을 제공해 직접 연동보다 운영 부담을 줄인다.
    출처: vercel.com/changelog/gemini-3-5-flash-on-ai-gateway원문 보기 →
5월 16일 (토)2 dispatches
  • `Gemini 3.5`, 복잡한 에이전트 워크플로우 겨냥

    `Gemini 3.5` targets complex agentic workflows
    100radar

    단순 답변보다 실행형 작업을 전면에 둔 모델 업데이트다. 가격·벤치마크 정보는 없지만, 자동화 체인 품질 검증 대상으로 바로 체크할 급이다.

    • 공식 google_deepmind 발표라 2차 반응글이 아니다. 신규 메이저 모델 시그널로 분류할 만하다.
    • 제공된 핵심 문구는 complex, agentic workflows 하나뿐. 가격, API 형태, 컨텍스트 길이는 확인 불가.
    • 검증 우선순위는 채팅 품질보다 도구 호출, 장기 작업 유지, 실패 복구, 코드 변경 신뢰도에 둬야 한다.
    출처: deepmind.google/blog/gemini-3-5-frontier-intelligence-wi원문 보기 →
  • `openai-python` `v2.37.0`, compact `responses`에 `service_tier` 추가

    `openai-python` `v2.37.0` adds `service_tier` to compact responses
    40radar

    responses의 축약 경로에서도 service_tier를 직접 넘길 수 있게 됐다. 이미 이 SDK를 쓰고 있다면 바로 올릴 만한 소규모 개선이고, 신규 도입을 결정할 정도의 변화는 아니다.

    • responses compact 메서드에 service_tier가 들어왔다. 지연시간·비용 티어 제어를 상위 호출에서도 맞출 수 있다.
    • 내부 타입이 pydantic iterator를 eager validation으로 처리한다. 스트리밍 파이프라인에서 잘못된 데이터가 더 빨리 드러난다.
    • 워크로드 아이덴티티 기반 인증에서 불필요한 client_id 요구를 제거했다. 클라우드 배포 인증 설정이 조금 덜 까다로워진다.
    출처: github.com/openai/openai-python/releases/tag/v2.37.0원문 보기 →
5월 14일 (목)3 dispatches
  • #0009모델·APIGeekNews

    Claude, 프로그래밍 방식 사용을 `월간 크레딧`으로 전환

    Claude shifts programmatic usage to monthly credits
    70radar

    유료 플랜 안에서 섞여 있던 프로그램형 사용량이 6월 15일부터 월간 전용 크레딧으로 분리된다. Agent SDK 자동화 비중이 크면 예산 추적은 쉬워지지만, 실효 단가는 다시 따져봐야 한다.

    • 적용 대상은 Claude Agent SDK, claude -p, Claude Code GitHub Actions, 서드파티 앱까지 포함. 자동화 스택 전체의 청구 방식이 한꺼번에 바뀐다.
    • 시점이 6월 15일로 박혀 있다. 배치 작업, CI, 에이전트 호출량이 많은 서비스라면 전환 전에 월간 소진 패턴부터 확인하는 편이 낫다.
    • 채팅형 사용과 프로그램형 호출 비용이 분리되면 예산 배분은 깔끔해진다. 대신 지금 쓰는 유료 플랜이 여전히 싼지 다시 계산해야 한다.
    • Agent SDK 기반 래퍼 앱도 포함된다. 다른 툴 레이어를 씌워도 우회되지 않아 숨은 자동화 비용이 더 선명하게 드러난다.
    출처: news.hada.io/topic?id=29494원문 보기 →
  • `anthropic-sdk-python` `v0.102.0`, 관리형 에이전트 검색 블록과 캐시 진단 베타 추가

    `anthropic-sdk-python` `v0.102.0` adds managed agent search block and cache diagnostics beta
    50radar
    anthropic-sdk-python파이썬 SDK — Anthropic API 기능을 typed로 빠르게 연동

    관리형 에이전트 검색 응답 타입과 cache diagnostics 베타가 파이썬 SDK에 들어왔다. Anthropic API를 직접 붙여 쓰면 디버깅 편의가 늘지만, 대부분에겐 우선순위 낮은 의존성 업데이트다.

    • BetaManagedAgentsSearchResultBlock 타입이 추가돼 관리형 에이전트 검색 응답을 수동 스키마 없이 바로 다루기 쉬워졌다.
    • cache diagnostics 베타 지원이 들어와 프롬프트 캐시 적중 여부와 재사용 상태를 더 투명하게 볼 수 있다.
    • pydantic iterator 검증을 eager 방식으로 바꿔 런타임 깊숙한 곳에서 터지던 타입 오류를 더 빨리 잡는다.
    • 릴리스 노트상 변화는 기능 몇 개와 spec 업데이트가 전부다. 가격·모델 변경급 영향은 없다.
    출처: github.com/anthropics/anthropic-sdk-python/releases/tag/원문 보기 →
  • `anthropic-sdk-typescript` `v0.96.0`, 관리형 에이전트 검색 타입과 캐시 진단 베타 지원 추가

    `anthropic-sdk-typescript` `v0.96.0` adds managed-agent search types and cache diagnostics beta
    50radar
    anthropic-sdk-typescriptTypeScript SDK — Anthropic 연동 타입 지원

    관리형 에이전트 검색 응답과 캐시 진단 베타가 TypeScript SDK에 붙었다. 직접 타입을 덧대던 구간이 줄어들어 Anthropic 연동 앱이면 올릴 만하지만, 체감은 작은 유지보수성 개선 수준.

    • BetaManagedAgentsSearchResultBlock 타입이 추가됐다. 관리형 에이전트 검색 응답을 다루는 코드에서 수동 타입 선언을 덜어낸다.
    • 캐시 진단 베타 지원이 들어왔다. 캐시 히트 여부나 동작 점검 흐름을 SDK 레벨에서 붙이기 쉬워진다.
    • zod는 이제 zod/v4 타입만 쓰도록 고쳤다. 버전 혼용으로 생기던 타입 충돌 가능성을 낮춘다.
    • 체인지로그 대부분은 API 스펙 업데이트다. 신규 제품급 변화보다는 기존 Anthropic 스택 정리용 업그레이드에 가깝다.
    출처: github.com/anthropics/anthropic-sdk-typescript/releases/원문 보기 →
5월 12일 (화)3 dispatches
  • #0006모델·APIr/ClaudeAI

    `Claude Platform` on `AWS`, 정식 출시

    `Claude Platform` on `AWS` Reaches General Availability
    60radar
    Claude PlatformAI 플랫폼 — AWS 계정·청구로 Claude API 전체 사용

    AWS 인증·청구·커밋 소진 체계로 Claude API 전체 기능을 바로 쓸 수 있게 됐다. 이미 AWS 비용 약정이 있다면 꽤 실용적이고, 없으면 Bedrock 대비 차별점은 운영 편의 쪽이다.

    • 계정 체계는 AWS를 쓰면서도 기능은 `Claude API` 전체를 연다. 결제선 통합이 필요한 팀에 특히 편하다.
    • Claude Managed Agents, 코드 실행, 웹 검색, 웹 페치, Files API, MCP 커넥터까지 포함돼 에이전트 워크플로를 한곳에서 붙일 수 있다.
    • 운영 주체는 Anthropic이라 신규 기능이 네이티브 API와 같은 날 들어온다. 서드파티 연동 특유의 기능 지연 부담이 적다.
    • 데이터를 AWS 인프라 안에서만 처리해야 하면 선택지는 여전히 Amazon Bedrock이다. 규제 조건이 빡빡할수록 이쪽이 더 명확하다.
    출처: www.reddit.com/r/ClaudeAI/comments/1ta7p4n/the_claude_pl원문 보기 →
  • `anthropic-sdk-python` `v0.101.0`, AWS용 Claude Platform 클라이언트 추가

    `anthropic-sdk-python` `v0.101.0` adds AWS Claude Platform client
    50radar
    anthropic-sdk-python파이썬 SDK — AWS 경로 Claude 연동을 직접 지원

    이제 파이썬 앱에서 AWS 경로로 Claude Platform을 더 바로 붙일 수 있다. AWS 인증·네트워크에 이미 올라탄 스택이면 편해졌지만, 그 외엔 당장 체감 변화는 작다.

    • 가장 큰 변경은 AWS용 클라이언트 추가 하나다. 새 모델 출시가 아니라 배포 경로와 연동 방식이 넓어진 업데이트다.
    • anthropic-sdk-python만으로 AWS 인증·계정 경계를 더 자연스럽게 가져갈 수 있어, 별도 래퍼나 어댑터 코드가 줄어든다.
    • 버그 수정은 파일 타입 에러 메시지의 f-string 누락 보정 정도다. 런타임 동작 변화보다 개발 경험 보정에 가깝다.
    • 예제는 tools_runner.py 모델을 claude-sonnet-4-5-20250929로 올리고 shebang도 uv 기준으로 바꿨다. 유지보수 기준선이 보인다.
    출처: github.com/anthropics/anthropic-sdk-python/releases/tag/원문 보기 →
  • `anthropic-sdk-typescript` `aws-sdk` `v0.3.0`, AWS용 클라이언트 추가

    `anthropic-sdk-typescript` `aws-sdk` `v0.3.0` adds an AWS client
    50radar
    anthropic-sdk-typescriptTypeScript SDK — AWS용 Claude 호출 클라이언트 추가

    AWS 환경에서 Claude 호출 경로가 SDK 기본 축으로 들어왔다. Lambda·ECS·IAM 위주로 묶인 스택이면 바로 편해지고, 그 외엔 지금 체감은 크지 않다.

    • 출시일은 2026-05-11. 이번 버전에서 확인되는 변경은 Claude Platform on AWS용 클라이언트 추가 1건뿐이다.
    • 비교 구간이 aws-sdk-v0.2.5...aws-sdk-v0.3.0이라 범위가 좁다. 대규모 개편보다 AWS 통합 보강에 가깝다.
    • 이미 Lambda, ECS, IAM 자격증명 흐름으로 굴리는 서비스라면 연결 코드가 줄어든다. 멀티클라우드면 우선순위는 낮다.
    출처: github.com/anthropics/anthropic-sdk-typescript/releases/원문 보기 →
5월 9일 (토)1 dispatches
  • `Grok Code Fast 1`, `GitHub Copilot` 전 영역에서 5월 15일 종료

    `Grok Code Fast 1` Deprecation Hits All `GitHub Copilot` Surfaces on May 15
    60radar
    Grok Code Fast 1코드 모델 — Copilot 전반에 쓰이던 고속 응답형

    다음 주면 GitHub Copilot 안의 모델 선택지 하나가 사라진다. 채팅부터 코드 완성까지 범위가 넓어서 프롬프트 결과나 체감 속도에 기대던 흐름은 지금 다시 점검해야 한다.

    • 종료 시점은 5월 15일로 못 박혔다. Copilot 워크플로를 이 모델 기준으로 맞춰뒀다면 대응 시간이 짧다.
    • 적용 범위가 Copilot Chat, inline edits, ask, agent mode, code completions까지라 특정 기능만의 변화로 끝나지 않는다.
    • 대체 모델이나 마이그레이션 가이드는 함께 나오지 않았다. 응답 품질·지연시간·코드 스타일 차이는 직접 확인해야 한다.
    • 자동화된 코딩 루프에 GitHub Copilot를 넣어뒀다면 단순 공지가 아니라 회귀 테스트 이슈다. 프롬프트 결과부터 다시 봐야 한다.
    출처: github.blog/changelog/2026-05-08-upcoming-deprecation-of원문 보기 →
5월 8일 (금)1 dispatches
  • GitHub Copilot의 `GPT-4.1`, `2026-06-01` 종료 예고

    `GPT-4.1` in GitHub Copilot will be deprecated on `2026-06-01`
    60radar

    GPT-4.1 사용 종료일이 `2026-06-01`로 박혔다. Copilot 전반에서 빠지는 일정이라 지금 대체 모델로 프롬프트와 결과물 차이부터 미리 확인하는 편이 낫다.

    • GitHub이 종료 시점을 `2026-06-01`로 못 박았다. 추후 공지가 아니라 실제 전환 작업을 잡아야 하는 일정이다.
    • 영향 범위가 Copilot Chat, 인라인 편집, ask, agent mode, 코드 완성까지 전부라 특정 기능만의 변화로 끝나지 않는다.
    • 대체 모델이 함께 안내되는 구조라 갈아타기 자체는 가능하지만, 응답 톤과 코드 제안 품질은 다시 검증해야 한다.
    • GPT-4.1 기준으로 쌓아둔 팀 프롬프트나 사용 습관이 있으면 6월 직전보다 지금 손보는 쪽이 덜 아프다.
    출처: github.blog/changelog/2026-05-07-upcoming-deprecation-of원문 보기 →
5월 7일 (목)1 dispatches
  • #0001모델·APIOpenAI

    `OpenAI API`, 추론·번역·전사를 묶은 실시간 음성 모델 추가

    `OpenAI API` adds new realtime voice models for reasoning, translation, and transcription
    70radar

    음성 입력 하나로 추론, 번역, 전사까지 잇는 흐름이 OpenAI API 안으로 들어왔다. 음성 UX를 더 자연스럽게 붙일 수 있어 지금 바로 실험해볼 만하다.

    • 새 음성 모델은 추론·번역·전사를 모두 처리한다. 음성 입력 뒤에 붙던 다단계 파이프라인을 줄일 여지가 생겼다.
    • 실시간 처리 지원이 핵심이다. 응답 지연이 짧아질수록 대화형 에이전트, 통역, 콜봇 경험이 훨씬 매끄러워진다.
    • 구성상 이점도 크다. 여러 음성 컴포넌트를 따로 엮기보다 OpenAI API 한 축으로 묶어 제품 복잡도를 낮출 수 있다.
    출처: openai.com/index/advancing-voice-intelligence-with-new-m원문 보기 →