telexed ~ c / 063f6127-a6fradar:60 · agent_toolLIVE
← 피드로
NO.
#063f6127
분야
에이전트·도구
출처
Hacker News · Show HN AI
게재
2026-05-02 02:18:24
중요도
★ 6/10 — radar 60
`agent-desktop`: 접근성 트리 기반 네이티브 데스크톱 자동화 CLI
FIG-0631:1

`agent-desktop`: 접근성 트리 기반 네이티브 데스크톱 자동화 CLI

`agent-desktop`: structured native desktop automation CLI for AI agents

픽셀 좌표 찍는 대신 OS 접근성 트리를 직접 다뤄 데스크톱 에이전트의 속도와 내구성을 끌어올렸다. 토큰 사용량 78~96% 절감 수치가 명확해서, 로컬 앱 자동화가 필요하면 지금 바로 시험해볼 만하다.

[ 요점 ]
  1. 스크린샷-좌표 예측-클릭 루프 대신 macOS Accessibility API, UI Automation, AT-SPI를 써서 실제 UI 요소를 조작한다.
  2. 배포 형태가 깔끔하다. 약 15MB짜리 Rust 단일 바이너리에 53개 명령어와 JSON 출력이 들어 있어 에이전트 연결이 쉽다.
  3. 전체 접근성 트리를 한 번에 덤프하지 않는다. Slack급 앱은 5만 토큰 이상까지 불어나서, 얕은 스냅샷 뒤 필요한 서브트리만 파고든다.
  4. @e1 같은 결정적 element ref와 부분 재조회 구조를 넣어 UI가 조금 흔들려도 덜 깨진다. 비전 기반 클릭보다 운영 안정성이 높다.
원문github.com/lahfir/agent-desktop원문 보기 →

// related