telexed ~ cat / agent_tool★4 이상 · 매시 갱신 · UTC+09LIVE
전체 에이전트·도구

에이전트·도구

50
오늘11 dispatches
  • GitHub, 악성 `VS Code` 확장으로 저장소 **3,800개** 침해 확인

    GitHub confirms 3,800 repositories compromised via malicious `VS Code` extension
    60radar

    직원 PC 하나가 내부 코드 접근점이 됐다. VS Code 확장도 공급망 리스크라서, 설치된 확장·권한·게시자 점검은 지금 바로 할 만함.

    • 직원 1명이 트로이목마화된 VS Code 확장을 설치한 뒤 내부 저장소 약 3,800개가 침해됐다.
    • 현재 평가는 유출 범위를 내부 저장소로 제한한다. 그래도 개발자 엔드포인트는 시크릿·소스·컨텍스트가 한곳에 모이는 고위험 지점.
    • GitHub는 해당 확장을 VS Code Marketplace에서 제거했고, 감염 엔드포인트를 격리한 뒤 사고 대응에 들어갔다.
    • 당장 할 일은 단순하다. 안 쓰는 IDE 확장 제거, 게시자 확인, 권한 검토, 업무용 프로필과 실험용 프로필 분리.
    출처: news.hada.io/topic?id=29731원문 보기 →
  • `Claude Code` `v2.1.146`, 코드 리뷰 명령과 백그라운드 세션 안정화

    `Claude Code` `v2.1.146` tightens code review and background sessions
    50radar
    Claude Code터미널 코딩 에이전트 — Claude 기반 코드 수정 자동화

    작은 릴리스지만 에이전트 실행 중 자주 거슬리던 실패 지점을 꽤 많이 줄였다. Windows·MCP·멀티에이전트 환경을 쓰면 바로 업데이트할 만함.

    • /simplify/code-review로 바뀌고 high 같은 effort 레벨을 받는다. 반복 리뷰 워크플로우에서 의도가 더 명확해짐.
    • MCP resources/list, resources/templates/list, prompts/list가 1페이지 뒤 항목을 누락하지 않는다. 큰 MCP 서버 연동 안정성이 올라갔다.
    • Windows 쪽은 pwsh 실행 실패, 터미널 스트로빙, NTFS junction cleanup, GNOME 붙여넣기까지 수정됐다. CLI 마찰이 줄어듦.
    • CLAUDE_CODE_SUBAGENT_MODEL이 멀티에이전트 자식 프로세스에 전달된다. 서브에이전트별 모델 라우팅이 덜 깨진다.
    • 자동 업데이트는 일시적 네트워크 실패를 재시도하고, 큰 파일 수정 diff 렌더링도 빨라졌다. 매일 쓰는 도구 안정성 개선.
    출처: github.com/anthropics/claude-code/releases/tag/v2.1.146원문 보기 →
  • Google Cloud, `Antigravity 2.0` 중심 에이전트 개발 도구 개편

    Google Cloud revamps agent development with `Antigravity 2.0`
    70radar
    Antigravity에이전트 개발 도구 — 로컬 프로토타입과 클라우드 연계

    로컬 프로토타입부터 클라우드 운영까지 한 흐름으로 묶는 방향이다. Managed Agents API가 배포·실행 관리를 줄여주면 바로 추적할 만함.

    • Antigravity 2.0Managed Agents API가 통합 개발 키트로 묶였다. 단순 데모보다 개발 플로우 재설계에 가깝다.
    • 로컬 환경에서 빠르게 만들고 Google Cloud에서 관리형으로 돌리는 구조. 오케스트레이션 코드를 줄일 여지가 있다.
    • 본문만으로 가격, 런타임 제약, 벤더 락인 수준은 확인 불가. 당장 이전보다 베타 추적 대상에 가깝다.
    출처: news.hada.io/topic?id=29718원문 보기 →
  • 휴대폰으로 `Claude Code` 바이브 코딩할 때 지키는 운영 규칙

    Rules for running phone-first vibe coding with `Claude Code`
    50radar
    Claude CodeAI 코딩 에이전트 — 터미널에서 코드 수정·실행 자동화

    코드를 안 읽는 방식도 계획 검토, 작은 단위, git 커밋, 테스트, DB 백업을 강제하면 꽤 통제 가능하다. 에이전트 활용 습관으로 바로 베껴볼 만함.

    • Plan mode가 사실상 품질 게이트. 모호한 항목은 구현 전에 되묻고, 나쁜 판단이 코드 전체로 번지는 걸 막는다.
    • 이해하기 어려운 계획은 작업이 너무 크다는 신호. 더 작은 청크로 쪼개면 리뷰와 롤백 부담이 줄어든다.
    • 계획 완료마다 git 커밋을 남기면 코드 상태는 되돌릴 수 있다. 단, DB 변경은 별도 백업이 필요.
    • 테스트 코드는 몰라도 테스트 케이스 목록은 읽어야 한다. 정상값, 음수, 누락값처럼 기대 동작을 먼저 고정한다.
    • 복잡한 변경은 서브에이전트로 계획 비판, 보안 리뷰, 테스트 감사를 분리. 사람 검토 지점을 늘리는 방식이다.
    출처: www.reddit.com/r/ClaudeAI/comments/1tj2i90/im_a_software원문 보기 →
  • `opencode` `v1.15.6`, TUI diff 리뷰와 shell mode 추가

    `opencode` `v1.15.6` adds TUI diff review and shell mode
    70radar
    opencode오픈소스 코딩 에이전트 CLI — TUI 중심 워크플로우

    변경 검토가 터미널 안으로 들어왔고, 실행 프롬프트에서 바로 셸 모드로 전환된다. 작은 패치 자동화보다 검수 포함 작업 흐름에 더 쓸 만해졌다.

    • TUI diff viewer가 첫 파일 자동 포커스와 단일 하위 디렉터리 접기를 지원한다. 에이전트 변경분 확인 비용이 줄어든다.
    • run에는 shell mode가 추가됐고 subagent 탭은 온디맨드 picker로 바뀌었다. 긴 세션에서 화면 소음이 줄어듦.
    • 플러그인 파일 로드 오류와 누락 args가 전체 로딩을 깨지 않는다. 개인 플러그인 실험 때 장애 범위가 작아진다.
    • v2 HTTP API는 구조화된 public error schema와 OpenAPI endpoint error responses를 노출한다. 래퍼 SDK 만들기 쉬워졌다.
    출처: github.com/anomalyco/opencode/releases/tag/v1.15.6원문 보기 →
  • `Antigravity 2.0` 업그레이드 후 IDE 워크플로우 깨짐

    `Antigravity 2.0` upgrade breaks IDE workflow for existing users
    60radar
    Antigravity코딩 에이전트 IDE — Google의 에이전트 우선 개발 도구

    기존 앱을 IDE·에이전트 전용·CLI로 쪼개는 과정에서 강제 전환, 공존 불가, 세션 하이재킹이 터졌다. 지금 메인 작업 도구로 올리기엔 위험한 릴리스.

    • 기존 사용자가 Antigravity IDE가 아니라 에이전트 전용 Antigravity 흐름으로 밀렸다. 마이그레이션 설계부터 어긋남.
    • Antigravity 2.0Antigravity IDE 2.0이 함께 설치되지 않는 문제가 보고됐다. 기존 IDE 의존 워크플로우엔 치명적.
    • 설치 후 세션이 하이재킹되어 IDE가 안 열리는 증상이 핵심 불만. 도움말은 1.x 기준이라 크레딧만 태우기 쉽다.
    • 확장 마켓플레이스가 빈 화면으로 뜨는 원인은 요청 폭주에 따른 rate limit로 지목됐다. QA 누락 신호가 강함.
    출처: discuss.ai.google.dev/t/my-antigravity-is-broken-the-2-0원문 보기 →
  • `Gemini CLI`, 2026년 6월 18일부터 작동 중단 예정

    `Gemini CLI` will stop working on June 18, 2026
    80radar
    Gemini CLI터미널용 AI CLI — Gemini를 명령줄에서 실행

    터미널 AI 워크플로우가 Antigravity CLI로 흡수된다. GitHub 스타 10만+ 도구에 종료일이 박혔으니, 자동화 스크립트와 습관을 빨리 갈아타야 함.

    • Gemini CLI수백만 사용자, GitHub 스타 10만+, 병합 PR 6,000개+까지 간 대형 터미널 도구였다.
    • Google은 기능을 Antigravity CLI로 통합한다. 방향은 단일 CLI보다 멀티 에이전트 흐름에 맞춰졌다.
    • 중단일은 2026년 6월 18일. 로컬 alias, CI 보조 스크립트, 팀 문서에 박힌 호출부터 교체해야 한다.
    출처: news.hada.io/topic?id=29711원문 보기 →
  • `jj`에서 생성 브랜치 이름 더 읽기 좋게 만들기

    Better generated branch names with `jj`
    40radar
    jjGit 호환 VCS — 익명 브랜치와 change 중심 워크플로우

    기본 push 이름이 change ID 중심이라 CLI와 PR 흐름에서 읽기 불편하다. 이미 jj를 쓰는 워크플로우라면 작은 설정 변경으로 Git 연동 마찰을 줄일 수 있음.

    • jj는 익명 브랜치를 권장하지만 Git 저장소에 push하려면 bookmark, 즉 Git 브랜치 이름이 필요하다.
    • 기본 jj git push --change xyzpush-xyz 형태를 만든다. 기계 친화적이지만 사람에게는 맥락이 약함.
    • PR 생성, 원격 브랜치 확인, cleanup에서 이름 가독성이 바로 비용이 된다. jj 미사용자에게는 당장 영향 작다.
    출처: news.hada.io/topic?id=29710원문 보기 →
  • `Google Antigravity`, 주간 쿼터 전환으로 장시간 코딩 흐름 악화

    `Google Antigravity` shifts toward weekly quotas, hurting long coding sessions
    60radar
    Google AntigravityAI 코딩 에이전트 — Google Gemini 기반 개발 도구

    짧은 리셋의 Flash 모델이 빠지면서 고강도 작업이 7일 쿼터에 묶였다. 매일 쓰는 코딩 에이전트보다 단발 작업용에 가까워졌다.

    • Gemini 3.0 Flash의 약 5시간 리셋이 사라진 게 타격. 코딩·테스트·리팩토링 반복 흐름이 끊긴다.
    • 유료 Ultra 사용자도 제한 영향을 받는다. 무료 티어 축소가 아니라 프로 워크플로우 비용 대비 가치 문제다.
    • 쿨다운이 길어지면 디버깅 세션마다 프롬프트를 아끼게 된다. Cursor·Codex 같은 대체 경로를 준비할 타이밍.
    출처: discuss.ai.google.dev/t/google-antigravity-has-come-to-a원문 보기 →
  • `Gemini Spark`, Google Workspace에 붙는 호스티드 에이전트

    `Gemini Spark`, Google’s hosted agent tied to Workspace apps
    60radar
    Gemini Spark호스티드 AI 에이전트 — Google 앱 네이티브 연결

    앱 연결형 에이전트를 Gmail·Drive·Docs까지 밀어 넣는 흐름이 선명해졌다. 다만 대부분 coming soon이라 지금은 제품보다 보안 설계 신호로 봐야 함.

    • Gemini Spark는 Gmail, Calendar, Drive, Docs, Sheets, Slides, YouTube, Maps와 네이티브 연결을 예고. 채팅보다 업무 대행 쪽에 가깝다.
    • FAQ상 실행 기반은 Gemini 3.5 FlashAntigravity. 데스크톱 앱, CLI, SDK, VS Code 포크까지 묶인 에이전트 스택이다.
    • 보안 설명은 매 작업 fresh isolated ephemeral VM, Agent Gateway DLP, 자격증명 암호화. 방향은 맞지만 검증은 아직 불가.
    • 민감한 메일·문서·캘린더를 다루는 구조라 prompt injection 리스크가 제품 성패를 가른다. GA 전 자동화 의존은 이르다.
    출처: simonwillison.net/2026/May/20/google-io/#atom-everything원문 보기 →
  • `GitHub Copilot`, VS Code에서 작업별 자동 모델 라우팅 도입

    `GitHub Copilot` in VS Code gets task-based auto model routing
    70radar

    모델을 손으로 고르는 흐름에서 작업·사용량·상태 기반 라우팅으로 넘어간다. 작은 코딩 루프의 마찰은 줄지만, 모델별 출력 차이를 통제하긴 더 어려워짐.

    • GitHub Copilot이 작업 적합도, 사용량, 모델 상태 지표로 모델을 고른다. 목표는 안정성·토큰 효율 개선.
    • VS Code 안에서 모델 전환 고민이 줄어든다. 버그 수정, 짧은 리팩토링, 설명 요청처럼 잦은 왕복에 특히 맞음.
    • 정밀한 결과가 필요한 대규모 리팩토링이나 디버깅은 수동 모델 선택을 유지하는 편이 낫다. 자동 라우팅은 분산을 만든다.
    출처: github.blog/changelog/2026-05-20-auto-model-selection-no원문 보기 →
어제20 dispatches
  • `GitHub Copilot Chat`, 시맨틱 이슈 검색 추가

    `GitHub Copilot Chat` Adds Semantic Issue Search
    80radar

    자연어로 이슈를 찾고 묶고 분석하는 흐름이 웹 채팅 안으로 들어왔다. 라벨 정리가 덜 된 저장소에서도 백로그 정리에 바로 써볼 만함.

    • semantic issues index가 문맥 기반 결과를 만든다. 정확한 키워드·라벨에 덜 묶여 이슈 탐색 비용이 줄어든다.
    • 지원 범위는 웹의 GitHub Copilot Chat. 별도 대시보드 없이 기존 GitHub 작업 흐름 안에서 분류·분석을 처리한다.
    • 중복 버그 찾기, 기능 요청 군집화, 릴리스 전 이슈 스코프 점검처럼 작은 팀의 반복 triage에 잘 맞는다.
    출처: github.blog/changelog/2026-05-20-semantic-issue-search-i원문 보기 →
  • `Codex Relay`, 모바일용 Terminal·Browser·Git·File Viewer·Markdown 탑재

    `Codex Relay` Adds Mobile Terminal, Browser, Git, File Viewer, and Markdown for Codex
    50radar
    Codex Relay모바일 Codex 보조 도구 — 터미널·Git·파일 뷰어 포함

    공식 원격 기능의 빈틈을 터미널·브라우저·Git·파일 뷰어로 메운 무료 OSS 보조 도구다. 핵심 워크플로우를 바꾸진 않지만 모바일 점검용으로 바로 시험해볼 만함.

    • Codex Relay100% 무료 오픈소스 기반. 모바일에서 Codex 작업 주변 도구를 한 화면에 묶는다.
    • 추가 기능은 Terminal, Browser, Git, File Viewer, Markdown. 이동 중 로그 확인·파일 검토에 맞다.
    • 공식 Codex Remote가 이미 나온 상태라 대체재보다는 보조재 성격. 도입 판단은 유지보수 속도가 가른다.
    • 비공개 저장소에 붙일 땐 인증 방식과 권한 범위를 먼저 확인해야 한다. 모바일 도구일수록 토큰 노출 리스크가 커진다.
    출처: news.hada.io/topic?id=29706원문 보기 →
  • `Antigravity`, 숨은 컴퓨트 과금 전환에 사용자 반발

    `Antigravity` users push back on hidden compute quotas
    60radar
    AntigravityAI 코딩 IDE — Google 모델 기반 에이전트 워크플로우

    요청 수 기준 한도가 숨은 compute-used 계산으로 바뀌며 유료 사용량 예측이 깨졌다. 저가 플랜은 작업 중 잠김 리스크가 커졌고, 비용 대비 애매.

    • $20 Pro 사용자가 2-3주간 HTTP 429로 막혔다고 보고. 대시보드 잔여 한도보다 실제 사용 가능성이 더 중요해짐.
    • 5월 19일 변경 후 요청 수가 아니라 숨은 compute-used로 한도를 차감. 백그라운드 스캔과 에이전트 미세 호출까지 예산 변수로 들어옴.
    • Gemini 3.5 Flash가 장황한 설명을 많이 내며 quota를 빨리 태운다는 불만. 코딩 품질보다 출력 통제가 병목이 됨.
    • 한도 소진 후 5일 잠김 또는 $100-$200 Ultra 업그레이드 압박이 언급됨. 주력 IDE로 쓰기엔 백업 경로가 필요.
    출처: discuss.ai.google.dev/t/how-antigravity-became-cursor-2-원문 보기 →
  • `Antigravity IDE` 2.0.1 macOS, 에이전트·마켓플레이스 먹통 DI 크래시 제보

    `Antigravity IDE` 2.0.1 macOS report: fatal DI crash disables agents and marketplace
    60radar
    Antigravity IDEAI 코딩 IDE — Google 에이전트 기능 내장

    클린 설치 후에도 agentSessions 의존성 누락으로 AI Agent Manager가 부팅 단계에서 죽는다. macOS에서 2.0 업데이트는 수정 전까지 보류가 낫다.

    • 환경은 Antigravity IDE 2.0.1, VSCode OSS 1.107.0, Apple M4 Max 기반 macOS Darwin arm64 25.5.0.
    • 핵심 에러는 [createInstance] aae depends on UNKNOWN service agentSessions; 에이전트 런타임이 시작도 못 한다.
    • 확장 마켓플레이스도 open-vsx.org manifest 요청에서 429가 나며 플러그인 설치가 막힌다.
    • ~/Library/Application Support/Antigravity IDE, ~/.antigravity, 캐시 삭제까지 해도 재현돼 설정 꼬임보다 빌드 결함에 가깝다.
    출처: discuss.ai.google.dev/t/bug-fatal-di-crash-on-clean-inst원문 보기 →
  • `Antigravity 2.0` Windows 업데이트, IDE 런처 탈취 문제

    `Antigravity 2.0` Windows update can hijack the IDE launcher
    60radar
    AntigravityAI 코딩 IDE — Google 계열 에이전트형 개발 도구

    기본 설치가 새 app.asar를 기존 IDE 폴더에 넣어 실행 파일이 2.0만 띄운다. 설정이 날아간 게 아니라 경로가 갈라진 상태라, 백업·복구 절차를 알아둘 만함.

    • Electron은 디렉터리 기준으로 리소스를 읽는다. resources\app.asar가 같은 설치 경로에 들어가면 기존 IDE 실행 파일까지 2.0으로 바뀜.
    • IDE로 되돌리려면 %LOCALAPPDATA%\Programs\Antigravity\resources에서 app.asarapp.asar.bak로 바꾸면 된다.
    • 설정 분리는 제품명 차이 때문이다. 기존은 Antigravity, 복구된 IDE는 Antigravity IDE빈 설정 폴더를 새로 만든다.
    • 복구는 Roaming\Antigravity 내용을 Roaming\Antigravity IDE로, .antigravity.antigravity-ide로 복사하면 끝난다.
    • 확장 복사 중 Windows 경로 길이 제한에 걸리면 관리자 CMD에서 mklink /Jextensions 폴더를 조인하면 된다.
    출처: discuss.ai.google.dev/t/fix-for-antigravity-2-0-hijackin원문 보기 →
  • `Antigravity`, 통합 에디터 제거 후 에이전트 허브 전환에 반발

    `Antigravity` backlash: editor removed, agent command center takes over
    60radar
    AntigravityAI 코딩 IDE — Google의 에이전트 중심 개발 도구

    파일·터미널·변경 추적을 한 화면에서 다루던 IDE 경험이 에이전트 지휘소로 바뀌며 반발이 나왔다. 실제 앱 디버깅 흐름에는 당장 마이너스다.

    • 불만의 초점은 명확함: Antigravity에서 코드 직접 확인, 파일 탐색, 터미널, 변경 추적의 일체감이 사라졌다.
    • CLI 대체 주장은 약하다. 앱 개발 중 디버깅·리뷰·수정이 오가는 흐름에서는 풀 IDE가 여전히 빠름.
    • CursorWindsurf가 견제하던 제품이라는 언급이 있음. 에디터 제거는 경쟁 포지션을 스스로 깎는 선택.
    • 참여 규모는 5개 포스트·3명뿐이라 시장 전체 반응은 아니다. 다만 핵심 워크플로우 손상 신호로 볼 만함.
    출처: discuss.ai.google.dev/t/you-did-not-upgrade-antigravity-원문 보기 →
  • 오염된 `VS Code` 확장으로 `GitHub` 내부 저장소 접근 사고

    GitHub Internal Repos Accessed After Employee Device Compromise
    40radar

    직원 개발 환경이 공급망 공격의 진입점이 됐다. 에디터 확장은 편의 기능이 아니라 코드 접근 권한을 가진 실행 파일로 봐야 함.

    • 공격 경로는 오염된 VS Code 확장 → 직원 기기 침해 → 내부 저장소 접근. 개발 PC가 곧 배포망 입구다.
    • GitHub은 악성 확장 버전을 제거하고 엔드포인트를 격리했다. 확장 자동 업데이트는 권한 있는 코드 실행으로 취급해야 한다.
    • 고객 데이터 영향이나 외부 저장소 침해 여부는 제공된 내용에 없다. 당장 할 일은 확장 목록 정리와 권한 축소.
    출처: news.hada.io/topic?id=29703원문 보기 →
  • `Cline CLI` `v3.0.9`, 플러그인 시작 속도와 설정 토글 개선

    `Cline CLI` `v3.0.9` speeds up plugin startup and config toggles
    50radar
    Cline코딩 에이전트 CLI — 플러그인 기반 자동화 지원

    플러그인 많은 CLI 세션의 시작 대기와 설정 변경 딜레이를 줄였다. Cline CLI를 매일 쓰는 환경이면 바로 업데이트할 만함.

    • 샌드박스 플러그인을 동시 로딩하고, 도구 descriptor를 플러그인·provider·model별로 캐싱한다. 플러그인 많은 구성에서 시작 지연이 줄어든다.
    • 플러그인·도구 설정 토글은 TUI를 먼저 갱신하고 전체 config reload 없이 저장한다. 도구를 자주 켜고 끄는 흐름이 가벼워짐.
    • @ mention 파일 선택기에 fuzzy ranking이 복구됐다. 관련 파일이 위로 올라와 프롬프트 준비 시간이 줄어든다.
    • 작업 취소 뒤에도 interactive CLI 세션을 유지한다. cancel 한 번에 세션이 죽던 흐름이 사라져 반복 작업에 덜 거슬린다.
    출처: github.com/cline/cline/releases/tag/cli-v3.0.9원문 보기 →
  • `Claude Code` 병목을 찾는 4가지 자동화 신호

    Claude Code workflow bottleneck: automate `Connect`, `Encode`, `Teach`, `Parallelize`
    50radar

    코드 작성보다 반복 마찰을 알아차리는 능력이 병목으로 바뀌었다. 일주일 마찰 로그만으로 스크립트·스킬·MCP·병렬 실행 후보가 바로 나온다.

    • Connect는 도구 사이 복붙·탭 전환이 신호. MCP 서버나 CLI로 에이전트가 원본에 직접 닿게 만든다.
    • Encode는 같은 순서의 작업 반복이다. 배포·디버깅·정리 루틴은 프롬프트보다 스크립트나 스킬이 맞다.
    • Teach는 같은 설명을 계속 입력하는 상태. 지속 컨텍스트는 CLAUDE.md나 스킬로 빼야 비용이 줄어든다.
    • Parallelize가 가장 큰 주장. 에이전트 출력 구경은 산출물을 바꾸지 않으니 여러 세션을 동시에 돌리는 쪽이 낫다.
    출처: www.reddit.com/r/ClaudeAI/comments/1ti8cwr/after_a_year_원문 보기 →
  • `Cursor Composer 2.5`, Cursor 내 최다 선택 모델 등극 — **10x** 사용량 보너스

    `Cursor Composer 2.5` becomes Cursor's most-selected model, with **10x** usage bonus
    80radar
    CursorAI 코딩 IDE — 에이전트형 코드 작성·수정 지원

    자체 코딩 모델이 IDE 안에서 외부 모델 기본 선택지를 밀어내기 시작했다. 사용량 제한이 하루 동안 풀린 만큼 실제 작업으로 바로 비교해볼 타이밍.

    • Michael Truell CEO는 Composer 2.5Cursor에서 가장 많이 선택되는 모델이 됐다고 밝혔다. 출시 직후 채택 속도가 빠르다.
    • 모든 사용자에게 하루 동안 10배 사용량을 제공한다. 장난감 프롬프트보다 실제 리팩토링·버그 수정으로 성능을 재보는 게 맞다.
    • Claude·OpenAI 모델 대비 IDE 네이티브 모델의 경쟁축이 생겼다. 벤치마크보다 지연시간, 쿼터, 편의성이 선택을 바꾼다.
    출처: news.hada.io/topic?id=29691원문 보기 →
  • `Mirage`, AI 에이전트용 통합 가상 파일시스템

    `Mirage`, a unified virtual filesystem for AI agents
    70radar
    MirageAI 에이전트용 가상 파일시스템 — SaaS를 단일 트리로 마운트

    여러 SaaS 백엔드를 하나의 파일 트리로 묶어 에이전트가 bash 도구로 다룬다. SDK·MCP별 접착 코드를 줄이는 방향이라 자동화 파이프라인에 바로 실험할 만함.

    • S3, Google Drive, Slack, Gmail, Redis단일 파일시스템 트리로 마운트 — 서비스별 접근 방식을 줄인다.
    • 에이전트는 각 서비스의 SDK나 MCP를 새로 익히지 않고 Unix 계열 bash 도구로 백엔드를 다룰 수 있음.
    • 서비스 간 파이프라인을 파일 입출력처럼 구성하는 모델. 데이터 이동·요약·동기화 자동화에 맞는다.
    출처: news.hada.io/topic?id=29681원문 보기 →
  • `Cursor Automations`, Agents Window 안으로 이동

    `Cursor Automations` Now Works Inside the Agents Window
    80radar
    CursorAI 코드 에디터 — 에이전트형 개발 워크플로우 내장

    예약형 에이전트 작업이 IDE의 메인 작업면에 더 가까워졌다. 멀티 repo·repo 없음 설정까지 열려 유지보수 자동화에 바로 써먹기 좋음.

    • Automations가 Agents Window에 들어와 예약 작업과 일반 에이전트 작업의 전환 비용이 줄었다.
    • 하나의 자동화에 여러 repo를 붙일 수 있어 공통 패키지 업데이트, 의존성 점검, 크로스 repo 리팩터링에 맞다.
    • repo 없이도 설정 가능해져 코드베이스 밖의 릴리스 노트, 이슈 정리, 리서치 큐 같은 운영 작업까지 커버한다.
    출처: cursor.com/changelog/05-20-26원문 보기 →
  • `Zed`, 터미널 에이전트용 사이드바 스레드 추가

    `Zed` Adds Terminal Threads for Coding Agents
    70radar
    Zed코드 에디터 — 빠른 협업·AI 워크플로우 중심

    터미널 에이전트를 흩어진 셸 세션이 아니라 사이드바 스레드로 다룰 수 있다. Claude Code·Amp를 코드 옆에 붙여 쓰는 워크플로우면 바로 체감된다.

    • Claude Code, Amp 같은 터미널 에이전트를 Zed 사이드바의 스레드 단위로 실행한다. 작업별 맥락 분리가 쉬워짐.
    • 일회성 터미널 탭보다 IDE 안에 남는 대화형 작업 로그에 가깝다. 리팩토링·디버깅 병렬 진행에 잘 맞음.
    • 모델 성능 변화는 아니고 에이전트 운용 UX 개선이다. 이미 Zed를 쓰는 경우 전환 비용 없이 시험할 만함.
    출처: zed.dev/blog/terminal-threads원문 보기 →
  • `GitHub Copilot` 코드 리뷰, `Fix with Copilot` 적용 대화창 추가

    `GitHub Copilot` Code Review Adds `Fix with Copilot` Dialog
    60radar

    리뷰 제안을 바로 패치하기 전에 적용 방식을 조절하는 흐름이 생겼다. PR 마무리 비용을 줄이는 작은 자동화지만, 멀티파일 수정 품질이 관건.

    • 기존 Implement suggestion 버튼이 Fix with Copilot으로 바뀜. 코드 리뷰 수정이 클라우드 에이전트 흐름으로 들어간다.
    • 새 UI 대화창에서 적용 방식을 더 조절할 수 있음. 원클릭 패치가 부담스러운 리뷰 코멘트에 완충 장치가 생겼다.
    • 효과가 큰 영역은 린트, 네이밍, 작은 리팩터링, 리뷰 nit 처리. 설계 변경 코멘트는 여전히 사람이 잡아야 한다.
    출처: github.blog/changelog/2026-05-19-easily-apply-copilot-co원문 보기 →
  • `Claude Code` `v2.1.145`, 세션 JSON 출력과 에이전트 추적 강화

    `Claude Code` `v2.1.145` adds JSON session listing and richer agent telemetry
    70radar
    Claude Code코딩 에이전트 CLI — 터미널에서 Claude로 코드 작업 자동화

    라이브 세션을 claude agents --json으로 뽑아 상태바·세션 피커·복구 스크립트에 붙일 수 있다. 서브에이전트 추적과 권한 우회 수정까지 있어 바로 올릴 만한 패치.

    • claude agents --json이 현재 실행 중인 세션을 JSON으로 노출한다. tmux-resurrect, 상태바, 세션 선택기 자동화에 바로 연결 가능.
    • agent_id, parent_agent_id가 OTEL span에 추가됐다. 백그라운드 서브에이전트 흐름을 부모 Agent span 아래에서 추적할 수 있음.
    • 상태줄 JSON 입력에 GitHub repo·PR 정보가 들어간다. CLI 안에서 PR 생성 후 footer badge 갱신 지연도 같이 고쳤다.
    • Bash 명령에서 allowlist 밖 환경변수 단독 할당이 자동 승인되던 권한 프롬프트 우회를 수정했다. 보안성 있는 업데이트다.
    • 플러그인 설치 전 commands, agents, skills, hooks, MCP/LSP 서버를 미리 보여준다. 마켓플레이스 설치 리스크가 줄어듦.
    출처: github.com/anthropics/claude-code/releases/tag/v2.1.145원문 보기 →
  • `Gemini Code Assist`, 6월 18일 종료 후 `Antigravity CLI` 전환 신호

    `Gemini Code Assist` sunset points to `Antigravity CLI` migration
    60radar
    Antigravity CLI코딩 에이전트 CLI — Code Assist 대체 경로

    6월 18일 종료 예고라 PR 리뷰 자동화는 마이그레이션 작업이 됐다. 문서 링크가 깨져 있어 바로 갈아타기보다 CI·리뷰 훅부터 점검하는 게 맞음.

    • 문서 기준 종료일은 6월 18일. Gemini Code Assist로 PR 리뷰를 돌리던 워크플로우는 대체 경로가 필요하다.
    • 후속 경로는 Antigravity CLI로 제시됐다. 호스팅형 보조 기능보다 로컬·CI CLI 자동화 쪽으로 무게가 옮겨간다.
    • 깨진 링크가 많다는 신호는 도입 리스크다. 드롭인 교체로 보면 삽질 가능성이 커서 사전 검증이 필요함.
    출처: discuss.ai.google.dev/t/gemini-code-assist-replaced-with원문 보기 →
  • `llm-gemini` `0.32a0`, reasoning token 스트리밍 추가

    `llm-gemini` `0.32a0` adds reasoning-token streaming
    40radar
    llm-geminiLLM CLI 플러그인 — Gemini 모델을 `llm`에서 호출

    Gemini 추론 출력이 llm CLI 알파 라인에서 실시간으로 흐른다. 기능 폭은 작지만 긴 프롬프트 디버깅 때 대기 시간을 줄여 바로 확인할 만함.

    • llm>=0.32a0가 필요해 안정판 사용자에게는 아직 바로 들어오는 변경이 아님.
    • 새 기능은 reasoning token 스트리밍. Gemini가 오래 생각하는 요청에서 중간 상태를 눈으로 확인할 수 있다.
    • 가격·모델 성능·API 계약 변경은 없다. 이미 llm CLI를 쓰는 워크플로우에만 작은 생산성 개선.
    출처: simonwillison.net/2026/May/19/llm-gemini/#atom-everythin원문 보기 →
  • `GitHub Copilot`, `Gemini 3.5 Flash` 정식 지원

    `Gemini 3.5 Flash` is now GA in `GitHub Copilot`
    80radar

    IDE 안에서 더 빠르고 싼 코딩 모델 선택지가 늘었다. near-Pro 품질을 Flash급 비용으로 제공한다면 반복 구현 작업부터 바로 시험할 만함.

    • GitHub Copilot에 Google의 최신 Flash-tier 모델이 정식 배포된다. 프리뷰가 아니라 일반 사용 단계로 넘어간 업데이트.
    • 초기 테스트 기준 near-Pro 코딩 품질과 Flash-tier 속도·비용을 내세운다. 자동완성·수정 루프 비용을 낮출 수 있음.
    • 운영 전략은 모델 라우팅이다. 설계 판단은 고급 모델에 맡기고, 반복 구현은 Gemini 3.5 Flash로 넘기면 효율적.
    출처: github.blog/changelog/2026-05-19-gemini-3-5-flash-is-gen원문 보기 →
  • `Cline CLI` `v3.0.8`, 플러그인 진단·Bedrock 설정·토큰 집계 수정

    `Cline CLI` `v3.0.8` fixes plugin diagnostics, Bedrock setup, and token counts
    50radar
    Cline오픈소스 코딩 에이전트 — IDE·CLI에서 에이전트 작업 실행

    화려한 기능 추가는 아니지만, 실제 자동화 운영에서 거슬리던 비용·설정·디버깅 문제를 정리했다. 로컬 에이전트 런타임을 쓰는 환경이면 바로 업데이트할 만함.

    • 실패한 플러그인이 config UI에 계속 남고 load/setup 단계와 에러를 보여준다. 깨진 플러그인 정의 추적이 빨라짐.
    • AgentRuntime.execute() 사용량 리셋 누락을 고쳐 부풀려진 토큰 사용량 집계를 바로잡았다. 비용 판단에 직접 영향.
    • AWS Bedrock CLI 온보딩에서 region/profile 감지를 수정했고 bearer token·추가 Bedrock 필드도 설정 화면에 노출된다.
    • Create Session Fork 단축키가 Opt+F에서 Opt+R로 이동했다. 터미널 word-right 이동 충돌이 사라짐.
    출처: github.com/cline/cline/releases/tag/cli-v3.0.8원문 보기 →
  • `Cline` `v3.84.0`, `SAP AI Core` 호스팅 모델 지원 추가

    `Cline` `v3.84.0` adds SAP AI Core hosted model support
    40radar
    ClineVS Code용 코딩 에이전트 — MCP와 다중 모델 지원

    호스팅 모델 선택지가 하나 늘었지만 범위는 좁은 통합 업데이트다. SAP AI Core를 이미 쓰는 환경이면 체크, 아니면 당장 워크플로우 변화는 작음.

    • SAP AI Core 지원으로 Cline 안에서 추가 호스팅 모델을 붙일 수 있음. SAP 기반 스택이 아니면 직접 효용은 제한적.
    • MCP 서버가 꺼져 있을 때 Restart Server 버튼을 비활성화한다. 에이전트 설정 화면에서 실수 동작을 줄이는 패치.
    • VS Code 확장 시작 흐름에서 Cline Kanban 런치 모달과 번들 데모 미디어를 제거했다. 첫 실행이 더 가벼워짐.
    출처: github.com/cline/cline/releases/tag/v3.84.0원문 보기 →
5월 19일 (화)19 dispatches
  • `Goal Setter`, `Codex` 장기 작업용 goal 작성 스킬

    `Goal Setter`, an agent skill for writing safer `Codex` goals
    50radar
    Goal SetterCodex agent skill — 완료 조건 인터뷰로 goal 작성

    긴 작업을 맡기기 전에 완료 조건을 먼저 고정하는 인터뷰형 스킬. Goal이 의도와 어긋나 토큰과 시간을 태우는 문제를 줄여, 큰 리팩터링 전에 써볼 만함.

    • CodexGoal 기능은 끝날 때까지 작업을 이어가지만, 목표가 흐리면 토큰과 시간이 크게 낭비된다.
    • Goal Setter는 goal 작성 전 사용자에게 필요한 요소를 묻는다. 프롬프트보다 완료 상태 정의가 먼저다.
    • 핵심 질문은 “정확히 어떤 상태가 완료인가”다. 테스트 통과, 파일 변경 범위, 금지 작업을 함께 박아야 한다.
    • 마이그레이션, 테스트 보강, 반복 리팩터링처럼 긴 작업에 적합. 설계 탐색형 작업은 사람 검토를 끼워야 안전하다.
    출처: news.hada.io/topic?id=29661원문 보기 →
  • 에이전트 셸 실행, `rm -rf /`까지 테스트한 사고

    Agent Shell Access Hit the `rm -rf /` Failure Mode
    40radar

    명령 화이트리스트를 검증하던 에이전트가 실제로 rm -rf /를 날렸다. 셸 권한을 주는 순간 샌드박스가 1순위이며, bwrap 같은 격리 없이는 위험 대비가 안 된다.

    • 화이트리스트가 막아서 실제 피해는 0이었다. 그래도 에이전트가 위험 명령을 직접 시도했다는 점이 더 중요함.
    • bubblewrap 격리는 화이트리스트 구현 뒤에 붙었다. 셸 실행 권한을 줄 때는 이 순서가 반대여야 한다.
    • 명령 허용 목록은 2차 방어선이다. 파일시스템 격리, 임시 워크스페이스, 권한 제한을 먼저 깔아야 한다.
    출처: www.reddit.com/r/LocalLLaMA/comments/1thosnt/got_my_firs원문 보기 →
  • `Nuxt MCP Toolkit`, `MCP apps` 지원 추가

    `Nuxt MCP Toolkit` adds support for MCP apps
    70radar
    Nuxt MCP ToolkitNuxt용 MCP 툴킷 — Vue SFC 기반 도구 UI 지원

    에이전트 도구 응답을 텍스트 대신 인터랙티브 HTML로 바로 렌더링할 수 있다. 상담형 UI·설정 패널·결과 리뷰 같은 도구 경험을 빠르게 붙일 만함.

    • defineMcpApp 매크로로 도구를 선언하면 Claude·ChatGPT 같은 MCP 클라이언트에서 인라인 HTML 응답을 렌더링한다.
    • useMcpApp에서 pre-hydrated 데이터를 읽고, 후속 프롬프트 실행이나 다른 도구 호출까지 UI 안에서 처리 가능.
    • Vue SFC를 빌드 시 self-contained HTML로 번들링해 MCP 엔드포인트에서 제공한다. 별도 프론트 배포 부담이 줄어든다.
    출처: vercel.com/changelog/nuxt-mcp-toolkit-mcp-apps원문 보기 →
  • `Claude Managed Agents`, `Cloudflare`에서 실행 지원

    `Claude Managed Agents` Run on `Cloudflare`
    80radar
    Claude Managed Agents코딩 에이전트 플랫폼 — 격리 실행·도구 커스터마이즈 지원

    에이전트 작업을 격리된 글로벌 실행 환경에서 돌리고, 비공개 백엔드 접근을 더 촘촘히 제어할 수 있다. 로컬 실험을 배포 파이프라인으로 올릴 때 써볼 만함.

    • Cloudflare가 자율 코드 전달용 빠르고 격리된 실행 환경을 제공한다. 별도 워커 인프라 운영 부담을 줄이는 방향.
    • 비공개 백엔드 접근 제어가 핵심이다. 에이전트에 넓은 권한을 주지 않고도 프로덕션 근처 작업을 맡길 수 있음.
    • 도구와 런타임 커스터마이즈를 지원한다. 테스트, 배포, 내부 API 호출 같은 repo별 워크플로우에 맞추기 쉽다.
    출처: blog.cloudflare.com/claude-managed-agents/원문 보기 →
  • `Forge`, 로컬 8B 에이전트 성공률을 프런티어 API 근처까지 끌어올림

    `Forge` Pushes Local 8B Agent Reliability Near Frontier APIs
    70radar
    ForgeLLM 가드레일 런타임 — 로컬 툴콜 안정성 강화

    모델을 키운 게 아니라 런타임 가드레일로 성공률을 올렸다. 반복 호출·복구·서빙 백엔드 선택이 모델 크기보다 큰 레버가 될 수 있어 바로 실험할 만함.

    • Ministral 8B+Forge99.3%, Claude Sonnet+가드레일은 100%. 로컬 에이전트 비용 구조를 다시 볼 숫자다.
    • retry nudge를 끄면 24-49포인트 하락. 에이전트 안정성은 프롬프트보다 런타임 재시도 설계가 먼저다.
    • 같은 Mistral-Nemo 12Bllama-server 네이티브 함수호출 7%, Llamafile 프롬프트 모드 83%로 갈렸다.
    • 복구 로직 없이는 로컬·프런티어 모델 모두 error recovery 0%. 실패 후 경로를 제품 코드에 명시해야 한다.
    출처: github.com/antoinezambelli/forge원문 보기 →
  • `Forge`, 로컬 LLM 툴콜링 안정화 가드레일 공개

    `Forge` pushes local LLM tool-calling reliability with guardrail retries
    70radar
    ForgeLLM 툴콜링 안정화 레이어 — 로컬 모델 가드레일 제공

    모델을 키우는 대신 재시도·단계 강제·오류 복구로 멀티스텝 성공률을 끌어올린다. 상시 에이전트를 로컬로 굴릴 때 API 비용을 줄일 현실적 옵션.

    • Ministral 8BForge 적용 시 99.3%, 같은 레이어의 Claude Sonnet100%를 기록. 모델보다 실행 시스템 차이가 컸다.
    • 가드레일 없는 Claude Sonnet87.2%에 그쳤다. 프론티어 API만 붙이는 설계가 항상 최선은 아님.
    • 재시도 nudges 제거 시 24-49포인트 하락, 오류 복구 제거 시 약 10포인트 하락. 핵심은 반복 실패를 구조적으로 다루는 부분.
    • 같은 Mistral-Nemo 12Bllama-server 네이티브 함수호출 7%, Llamafile 프롬프트 모드 83%. 서빙 백엔드가 벤치 결과를 뒤집는다.
    출처: github.com/antoinezambelli/forge원문 보기 →
  • `Forge`, 가드레일만으로 로컬 8B 에이전트 성공률 53%→99%

    `Forge` raises local 8B agent task success from 53% to 99% with guardrails
    70radar
    ForgeLLM 툴콜링 가드레일 — 로컬 모델 재시도·복구 강화

    모델 교체보다 오케스트레이션이 성능을 갈랐다. Forge는 클라우드 에이전트 비용이 부담될 때 로컬 툴콜링을 실전 후보로 올려놓음.

    • Ministral 8B+Forge가 멀티스텝 워크플로에서 99.3%를 기록. 같은 가드레일의 Claude Sonnet100%였다.
    • 재시도 메커니즘이 없으면 로컬·프런티어 모델 모두 에러 복구 점수 0%. 모델 능력보다 아키텍처 공백이 컸다.
    • 같은 Mistral-Nemo 12B도 백엔드에 따라 llama-server 7%, Llamafile 프롬프트 모드 83%로 갈렸다.
    • 어블레이션에서 실속은 retry nudge와 error recovery. rescue parsing·context compaction은 드물게 터지는 운영 장애용에 가깝다.
    출처: github.com/antoinezambelli/forge원문 보기 →
  • `Forge`, 로컬 8B 에이전트 작업을 프론티어급 신뢰도로 끌어올림

    `Forge` brings local 8B agent workflows near frontier reliability
    70radar
    ForgeLLM 가드레일 레이어 — 로컬 툴콜링 신뢰도 보강

    모델 크기보다 가드레일 설계가 결과를 갈랐다. retry nudges와 오류 복구가 로컬 상시 에이전트의 클라우드 비용 대안을 현실화해, 바로 실험할 만함.

    • Ministral 8B+Forge99.3%, Claude Sonnet+가드레일은 100%. 로컬 8B와 프론티어 API 격차가 1포인트 미만.
    • 가드레일 없는 Claude Sonnet87.2%에 그쳤고, 프레임워크 보강된 로컬 8B가 더 높았다. 모델 선택보다 실행 구조가 변수.
    • 가장 큰 기여는 retry nudges와 오류 복구. 재시도 유도를 끄면 24-49포인트 하락해, 단순 재프롬프트가 핵심 안전장치가 됨.
    • 서빙 백엔드 차이도 컸다. 같은 Mistral-Nemo 12Bllama-server 함수 호출 7%, Llamafile 프롬프트 모드 83%로 갈렸다.
    출처: github.com/antoinezambelli/forge원문 보기 →
  • `Forge`, 로컬 LLM 에이전트용 재현 가능한 가드레일 공개

    `Forge` adds reproducible guardrails for local LLM agents
    70radar
    Forge로컬 LLM 툴콜 신뢰성 레이어 — 재시도·복구 가드레일 제공

    툴콜 실패를 모델 크기보다 시스템 문제로 다룬다. 공개 수치가 재현되면 상시 실행 에이전트 비용을 클라우드 API 의존 없이 크게 낮출 수 있음.

    • Ministral 8B는 가드레일 적용 후 99.3%, 같은 레이어의 Claude Sonnet100% 기록. 성능 격차가 1포인트 미만.
    • 재시도 메커니즘이 없으면 로컬·프론티어 모델 모두 오류 복구 0%. 모델 능력보다 실행 구조가 병목이다.
    • 기여도는 재시도 넛지와 오류 복구가 대부분. 제거 시 각각 24-49포인트, 약 10포인트 하락했다.
    • 같은 Mistral-Nemo 12B도 백엔드에 따라 7%→83%로 갈렸다. 서빙 스택까지 벤치해야 한다.
    출처: github.com/antoinezambelli/forge원문 보기 →
  • Anthropic, MCP 서버 생성기 핵심 업체 `Stainless` 인수

    Anthropic acquires `Stainless`, the major MCP server generator
    80radar
    StainlessSDK 생성 플랫폼 — OpenAPI로 SDK·MCP 서버 생성

    OpenAPI에서 MCP 서버까지 뽑아내던 가장 강한 파이프라인이 신규 사용자에게 닫혔다. 템플릿 품질은 오르겠지만, 스택 집중 리스크도 바로 커졌다.

    • StainlessOpenAI, Google, Meta, Cloudflare, Anthropic 공식 SDK 생성에 쓰였고, 같은 컴파일러를 MCP 서버까지 확장했다.
    • MCP는 2025년 12월 월 9,700만 SDK 다운로드, 2026년 초 프로덕션 서버 약 1만 개까지 커졌다.
    • 월요일부터 신규 가입과 새 SDK/MCP 생성이 중단됐다. 기존 고객은 생성된 코드를 유지하지만 파이프라인은 닫힘.
    • Cloudflare MCP 프레임워크, Pulse MCP, 오픈소스 생성기가 대체 축으로 중요해졌다. Anthropic 단일 의존은 피하는 편이 낫다.
    출처: www.reddit.com/r/ClaudeAI/comments/1thkkrb/anthropic_jus원문 보기 →
  • 개인용 AI 에이전트 만들 때 바로 재사용할 100가지 운영 규칙

    100 Practical Rules for Building a Persistent Personal AI Agent
    50radar

    6주간 만든 지속형 에이전트에서 나온 설계 체크리스트다. 헌법·정체성·기능 지도·로컬 자동화처럼 바로 베낄 구조가 있어 튜토리얼 가치 있음.

    • 시스템 프롬프트보다 헌법을 먼저 둔다. 규칙 밖 상황에서 Claude가 명령 목록이 아니라 원칙으로 판단하게 만드는 장치다.
    • 하드 룰과 행동 가이드는 분리해야 한다. 섞이면 모든 지시가 협상 가능해지거나, 반대로 아무것도 유연하게 못 바꾼다.
    • Capability Map과 Component Map을 따로 관리한다. 할 수 있는 일과 연결 구조를 분리해야 3개월 뒤에도 유지보수가 된다.
    • 클라우드에서 Claude Code로 옮기며 파일 접근, git 추적, shell hook, 예약 headless 작업이 핵심 차이가 됐다.
    • 초기 3주는 개발 100%, 이후 50:50, 현재 20:80으로 전환. 에이전트 구축은 초반 자동화 부채를 감수하는 작업이다.
    출처: www.reddit.com/r/ClaudeAI/comments/1thi6nh/100_tips_tric원문 보기 →
  • `Power Automate` 웹훅으로 M365를 MCP 도구화하는 방식

    Using `Power Automate` Webhooks as an MCP Bridge for Microsoft 365
    50radar
    Power Automate업무 자동화 SaaS — M365 커넥터를 웹훅으로 실행

    Graph 권한 승인 없이 기존 M365 계정 권한을 Claude 도구 호출로 우회 연결한다. 개인 운영 자동화에는 쓸 만하지만, 웹훅 관리가 보안·오작동의 핵심 리스크.

    • M365 작업마다 Power Automate HTTP 트리거 플로우를 만들고, FastMCP 서버가 이를 Claude 도구로 노출하는 구조.
    • 구현 범위는 22개 플로우. 메일, 캘린더, OneDrive, Planner, Excel, Word 템플릿까지 사무 자동화 대부분을 커버했다.
    • 웹훅 URL은 사실상 비밀번호다. 중복 URL 설정 하나로 ‘올바른 도구 호출, 잘못된 M365 실행’이 발생했다.
    • 약 200줄 Python과 JSON 설정으로 충분하다는 점이 포인트. 공식 Graph 통합보다 빠른 내부 자동화 루트가 된다.
    출처: www.reddit.com/r/ClaudeAI/comments/1thabze/i_gave_claude원문 보기 →
  • Anthropic, 에이전트 도구 연결 강화 위해 `Stainless` 인수

    Anthropic Acquires `Stainless` to Expand Agent Tooling
    50radar
    StainlessAPI 도구 SaaS — SDK·MCP 서버 생성 지원

    답변 품질보다 실제 시스템에 얼마나 붙을 수 있는지가 에이전트 경쟁력이 됐다. 당장 쓸 기능은 아니지만 Claude 통합 범위 확대 신호로 볼 만함.

    • Stainless는 SDK와 MCP 서버 도구를 만드는 회사. 인수 초점은 모델 자체보다 API 연결 계층에 있음.
    • 에이전트가 데이터와 도구에 접근해야 쓸모가 커진다는 판단이 깔려 있다. MCP 생태계 확장에 힘이 실릴 가능성 큼.
    • 가격, 출시일, 새 기능은 공개되지 않았다. 오늘 적용할 액션보다는 Claude 기반 자동화 로드맵 체크용 신호.
    출처: news.hada.io/topic?id=29647원문 보기 →
  • `Project Glasswing`: `Mythos`가 보여준 것

    `Project Glasswing`: What `Mythos` Demonstrated
    60radar
    Mythos보안 에이전트 — 익스플로잇 체인 자동 증명

    의심 코드 표시에서 끝나지 않고 익스플로잇 경로를 실제로 증명하는 쪽으로 넘어갔다. 아직 초기지만, 버그바운티·보안 리뷰 자동화의 체감 품질을 바꿀 신호다.

    • Mythos PreviewCloudflare 50개 이상 저장소에서 단일 버그가 아니라 여러 원시 요소를 엮어 익스플로잇 체인을 구성했다.
    • 트리거 코드를 직접 만들고 임시 컴파일·실행까지 수행. 정적 분석 알림보다 재현 가능한 증거에 가까워짐.
    • 실패하면 가설을 수정해 다시 시도했다. 코딩 에이전트가 보안 검증 루프까지 맡는 방향이 선명하다.
    출처: news.hada.io/topic?id=29645원문 보기 →
  • `Git` `--author` 플래그로 GitHub AI 봇 스팸 막기

    Using Git `--author` to Block AI Bot Spam in GitHub Repos
    40radar

    AI발 PR·댓글이 실제 기여 논의를 순식간에 덮는다. Git 작성자 정보를 필터로 쓰는 방식은 바운티 이슈 운영에 바로 적용 가능한 저비용 방어책.

    • Archestra의 $900 바운티 이슈가 AI 봇 댓글로 253개 댓글까지 불어남. 보상형 이슈는 스팸 타깃이 되기 쉽다.
    • 문제는 양만이 아님. 무의미한 댓글·PR에 공격적 태도까지 섞이며 유지관리자의 판단 비용을 키웠다.
    • git --author 기반 차단은 리뷰 전에 신원 패턴을 거르는 장치. 완벽한 보안보다 운영 소음 감소에 초점이 맞다.
    출처: news.hada.io/topic?id=29642원문 보기 →
  • `Claude Code` `v2.1.144`, 백그라운드 세션·MCP·터미널 안정성 개선

    `Claude Code` `v2.1.144` improves background sessions, MCP tools, and terminal stability
    80radar
    Claude Code코딩 에이전트 CLI — 터미널에서 Claude로 코드 작업 자동화

    백그라운드 에이전트를 다시 찾고 실행 시간을 확인하기 쉬워졌다. 더 큰 수확은 장시간 작업에서 MCP 누락, 터미널 깨짐, 시작 지연이 줄어 실전 자동화 신뢰도가 오른 점.

    • /resumeclaude --bg와 agent view로 시작한 세션이 bg 표시로 함께 뜬다. 여러 작업을 돌릴 때 복귀 비용이 줄어든다.
    • 백그라운드 subagent 완료 알림에 3h 2m 5s 같은 경과 시간이 붙는다. 오래 도는 작업의 비용·병목 추적에 바로 유용함.
    • /model은 현재 세션만 바꾸고, 기본값은 모델 선택기에서 d로 지정한다. 세션 간 모델 설정 꼬임을 줄이는 변경.
    • MCP tools/list 페이지네이션 버그가 고쳐졌다. 도구가 많은 MCP 서버에서 일부 툴이 조용히 사라지는 문제가 사라짐.
    • api.anthropic.com 접속 불가 시 시작 대기가 최대 75초에서 15초 타임아웃으로 줄었다. VPN·방화벽 환경에서 체감 크다.
    출처: github.com/anthropics/claude-code/releases/tag/v2.1.144원문 보기 →
  • `Codex`의 `Goals`로 장기 작업 굴리기

    Using `Codex` `Goals` for Long-Running Tasks
    50radar
    Codex코딩 에이전트 — 여러 턴 작업을 목표 중심으로 지속

    프로파일링·패치·벤치마크처럼 여러 턴이 필요한 일을 목표 달성까지 이어가게 만든다. 긴 작업을 잘게 재촉하던 비용이 줄어 바로 써볼 만함.

    • GoalsCodex 스레드에 영속적 목표를 붙여, 한 번의 응답이 아니라 여러 턴에 걸쳐 결과를 향하게 만든다.
    • 단일 프롬프트로 어려운 프로파일링, 패치, 벤치마킹, 플레이키 테스트 재현에 맞다. 반복 확인이 줄어든다.
    • 근거 기반 감사처럼 중간 산출물 확인이 필요한 작업에도 적합. 목표와 종료 조건을 좁게 잡아야 낭비가 적다.
    출처: news.hada.io/topic?id=29639원문 보기 →
  • 비개발 PM용 `Claude Code` 단계별 워크플로우

    `Claude Code` Workflow for Non-Technical PMs
    50radar
    Claude Code코딩 에이전트 CLI — 터미널에서 코드 수정·실행 자동화

    노코드 빌더에서 시작해 코딩 에이전트 기반 자동화로 넘어가는 경로를 잡아준다. 코드·성과 수치가 없어 깊이는 얕지만, 도입 순서 참고용으론 쓸 만함.

    • 출발점은 Lovable 같은 빌더, 도착점은 Claude Code멀티 에이전트 시스템. 프로토타입 이후 자동화 전환 흐름을 잡기 좋다.
    • 대상은 비개발 PM이라 구현 디테일보다는 작업 분해와 도구 전환 순서에 초점이 맞춰진다.
    • 성과 수치, 코드 예시, 실패 조건이 없다. 새 기능 발표가 아니라 가벼운 튜토리얼 신호로 보는 게 맞음.
    출처: www.news.aakashg.com/p/claude-code-non-technical-pms원문 보기 →
  • `Copilot cloud agent`, 실패한 `GitHub Actions` 원클릭 수정 지원

    GitHub adds one-click Action failure fixes with `Copilot cloud agent`
    70radar
    Copilot cloud agent코딩 에이전트 — GitHub 작업을 클라우드에서 자동 수행

    실패한 CI를 Actions 화면에서 바로 에이전트에게 넘길 수 있다. 유료 플랜 한정이지만, 테스트 실패 수정 루프를 줄이는 기능이라 지금 확인할 만함.

    • 실패한 GitHub Actions job에 Fix with Copilot 버튼이 붙고, 원클릭으로 수정 작업을 위임한다.
    • 대상은 Copilot BusinessCopilot Enterprise 구독자. 무료 계정이나 개인 Copilot 플랜에는 바로 열린 기능이 아님.
    • 효과는 IDE 전환 감소다. CI 실패 확인 후 브랜치 수정까지 에이전트 루프로 바로 이어진다.
    출처: github.blog/changelog/2026-05-18-one-click-fixes-for-fai원문 보기 →