← 피드로 archive / 2026 / 05

2026-05-02

2026년 5월 2일 토요일 · 13 건 · ★ avg 5.5

#0013
#0013에이전트·도구 r/LocalLLaMA3주 전
`LDR`, 단일 `RTX 3090` 로컬 딥리서치에서 **95.7%** `SimpleQA` 달성
`LDR` pushes local deep research to **95.7%** `SimpleQA` on one `RTX 3090`
60radar
LDR로컬 딥리서치 에이전트 — 단일 RTX 3090으로 95.7%
성능을 끌어올린 건 모델 자체보다 에이전트 오케스트레이션과 검색 루프다. 완전 로컬 구성도 호스티드 딥리서치 급에 근접해, 프라이버시 중시 워크플로에 지금 바로 넣어볼 만하다.
- 구성은 Ollama + qwen3.6:27b + langgraph_agent 조합이다. 툴콜, 병렬 하위주제 분해, 최대 50회 반복으로 에이전트 설계 비중이 크다.
- 벤치마크는 SimpleQA 95.7%(287/300), xbench-DeepSearch 77.0%(77/100)다. 같은 스택의 Qwen3.5-9B보다 격차가 커 세대 개선 효과가 선명하다.
- 폐쇄형 지식 테스트가 아니라 검색 포함 점수다. Perplexity Deep Research 93.9%, Tavily 93.3%와 비교할 때 로컬 대안으로 경쟁력이 생겼다.
- 단, 샘플 수가 작고 자체 채점 노이즈도 있다. SimpleQA 오염 가능성과 중국어 벤치 편향까지 있어 절대 성능으로 받아들이면 위험하다.
- 보안·운영 측면도 강하다. OpenAlex·DOAJ 기반 저널 품질 평가, 사용자별 SQLCipher 암호화, 제로 텔레메트리까지 붙었다.
출처: www.reddit.com/r/LocalLLaMA/comments/1t1n6o8/we_are_fina원문 보기 →
60radar
PHOTO
FIG-0131:1
#0012
#0012아이디어 시그널 Hacker News · Show HN AI3주 전
`SimplePDF Copilot`, 클라이언트 툴콜링으로 PDF 폼 채우기
`SimplePDF Copilot`: AI PDF form filling with client-side tool calling
60radar
SimplePDF CopilotPDF 코파일럿 — 브라우저 내 폼 작성·편집 실행
문서 내용을 읽는 수준이 아니라 브라우저 안에서 필드 입력·추가·페이지 삭제까지 실행한다. 개인정보를 서버로 넘기지 않는 설계와 BYOK·로컬 모델 지원 조합이 문서 워크플로 SaaS에 바로 참고할 만하다.
- PDF 원본은 브라우저 밖으로 나가지 않는다. 파싱·렌더링·필드 탐지까지 클라이언트에서 돌아가 의료·세금 문서 처리에 유리하다.
- 기존 Chat with PDF와 달리 검색만 하지 않는다. 필드 채우기, 포커스 이동, 필드 추가, 페이지 삭제까지 실제 편집 액션을 수행한다.
- 툴콜링 실행 경로가 서버가 아니라 브라우저다. iframe postMessage 기반이라 응답 속도가 빠르고 모델에 넘길 데이터 범위도 강하게 통제된다.
- 모델 종속성도 낮췄다. 기본 프록시는 데모용이고 BYOK로 아무 클라우드 모델이나 붙일 수 있으며 LM Studio 같은 로컬 실행도 테스트했다.
- 이미 월간 20만+ 사용자가 쓰는 PDF 편집기에 얹은 형태라 신규 AI 기능보다 강하다. 기존 업무 흐름 위에 코파일럿을 붙이는 방식이 더 현실적이다.
출처: copilot.simplepdf.com/?share=a7d00ad073c75a75d493228e6ff원문 보기 →
FIG-0121:1
60radar
FIG-0121:1
#0011
#0011에이전트·도구 Hacker News · Show HN AI3주 전
`agent-desktop`: 접근성 트리 기반 네이티브 데스크톱 자동화 CLI
`agent-desktop`: structured native desktop automation CLI for AI agents
60radar
agent-desktopCLI 도구 — 접근성 트리로 네이티브 UI 자동화
픽셀 좌표 찍는 대신 OS 접근성 트리를 직접 다뤄 데스크톱 에이전트의 속도와 내구성을 끌어올렸다. 토큰 사용량 78~96% 절감 수치가 명확해서, 로컬 앱 자동화가 필요하면 지금 바로 시험해볼 만하다.
- 스크린샷-좌표 예측-클릭 루프 대신 macOS Accessibility API, UI Automation, AT-SPI를 써서 실제 UI 요소를 조작한다.
- 배포 형태가 깔끔하다. 약 15MB짜리 Rust 단일 바이너리에 53개 명령어와 JSON 출력이 들어 있어 에이전트 연결이 쉽다.
- 전체 접근성 트리를 한 번에 덤프하지 않는다. Slack급 앱은 5만 토큰 이상까지 불어나서, 얕은 스냅샷 뒤 필요한 서브트리만 파고든다.
- @e1 같은 결정적 element ref와 부분 재조회 구조를 넣어 UI가 조금 흔들려도 덜 깨진다. 비전 기반 클릭보다 운영 안정성이 높다.
출처: github.com/lahfir/agent-desktop원문 보기 →
FIG-0111:1
60radar
FIG-0111:1
#0010
#0010에이전트·도구 GitHub Changelog3주 전
`GitHub Copilot`, `GPT-5.2`·`GPT-5.2-Codex` 단계적 종료 예고
`GitHub Copilot` to phase out `GPT-5.2` and `GPT-5.2-Codex`
60radar
코파일럿 전반에서 구형 기본값 정리가 시작됐다. 워크플로에 특정 모델명을 박아뒀다면 지금 교체 후보를 정하고, 새 모델 출력 회귀를 먼저 보는 편이 낫다.
- 적용 범위가 넓다. Copilot Chat, 인라인 수정, ask, agent 모드, 코드 완성까지 포함돼 특정 화면만 써도 영향권이다.
- 예외 문구가 붙었다. GPT-5.2-Codex는 Copilot의 일부 경험에선 더 남아, 전면 종료보다 단계적 이전에 가깝다.
- 모델명을 문서, 프롬프트, 평가 기준에 박아뒀다면 지금 바꿔야 한다. 마감 직전 교체보다 출력 차이 검증 비용이 훨씬 낮다.
출처: github.blog/changelog/2026-05-01-upcoming-deprecation-of원문 보기 →
FIG-0101:1
60radar
FIG-0101:1
#0009
#0009에이전트·도구 r/ClaudeAI3주 전
Anthropic, `Claude Security` 엔터프라이즈 공개 베타 시작
Anthropic Opens `Claude Security` Public Beta for Enterprise
60radar
Claude Security보안 스캐너 — 코드 맥락·자기검증으로 오탐 감소
룰 기반 탐지 대신 코드 흐름, Git 이력, 비즈니스 로직까지 읽고 결과를 스스로 반박한 뒤 올린다. 오탐 줄이는 방향은 좋지만, 치명적 시스템 패치는 사람 검토 없인 못 쓴다.
- 대상은 고심각도 취약점 중심. 메모리 손상, 인젝션, 인증 우회, 복합 로직 오류까지 컨텍스트로 추적한다.
- 탐지 후 바로 내보내지 않고 적대적 자기검증을 한 번 더 거친다. 보안 스캐너의 고질적 오탐 피로도를 정면으로 건드렸다.
- 모든 결과에 코드 스타일과 구조를 맞춘 수정안까지 붙인다. 분류 속도는 빨라지지만 머지 권한은 여전히 사람 손에 남겨뒀다.
- Slack, Jira, 웹훅 연동에 디렉터리 범위 지정, 예약 스캔까지 지원한다. 기존 개발 플로우에 얹기 쉬운 구성이네.
출처: www.reddit.com/r/ClaudeAI/comments/1t12l3t/anthropic_jus원문 보기 →
60radar
PHOTO
FIG-0091:1
#0008
#0008에이전트·도구 Hacker News · Show HN AI3주 전
`Adam`, `Fusion`·`Onshape`용 인-CAD 에이전트 베타 공개
`Adam` launches in-CAD agent beta for `Fusion` and `Onshape`
60radar
AdamCAD 에이전트 — 피처 트리를 직접 읽고 수정
검은상자식 STL 생성 대신 기존 피처 트리를 읽고 직접 수정한다. CAD 정리·파라미터화 같은 실무 작업에 바로 붙고, 기존 툴 안에서 통제권도 유지돼 지금 써볼 만함.
- 기존 text-to-CAD 데모 노선에서 벗어나 CAD 내부 통합으로 선회했다. 결과물만 던지는 방식보다 피처 트리 제어를 중시하는 팀에 더 맞는다.
- 현재 작업 범위가 꽤 실용적이다: 중복 피처 병합, 트리 일괄 리네이밍, 내부 엣지 2mm 필렛, 모델 파라미터화, 엔드투엔드 생성까지 간다.
- Onshape는 FeatureScript, Fusion은 Python을 적극 활용한다. UI 자동화보다 코드 레이어를 잡는 접근이라 확장성과 재현성이 낫다.
- 모델 종속 대신 내부 벤치 기준으로 작업별 최적 모델을 고른다. 특정 랩 락인 없이 성능 좋은 모델을 갈아끼우는 운영 전략이 분명하다.
출처: fusion.adam.new/install원문 보기 →
FIG-0081:1
60radar
FIG-0081:1
#0007
#0007아이디어 시그널 r/microsaas3주 전
개발자용 ‘얼굴 없는’ SEO 자동화, 커뮤니티 댓글만으로 **첫 7명** 유료 전환
Faceless SEO automation found its first **7 paying users** through niche community posts
50radar
SEO 조사, X 브랜딩, 영상 마케팅을 피하려다 아예 자동화 도구를 만들었고 개발자 커뮤니티 댓글 몇 개로 첫 결제가 붙었다. 큰 런치 없이도 먹히는 좁은 문제라는 뜻이라, 비슷한 워크플로 자동화는 지금 검증해볼 만하다.
- 출발점이 선명하다. 수동 키워드 리서치와 퍼스널 브랜딩 거부감이 강해, 아예 기술 SEO 구조화를 자동화하는 쪽으로 제품을 틀었다.
- 배포 채널도 작지만 맞았다. Product Hunt·광고 없이 개발자 서브레딧에 남긴 몇 개의 솔직한 댓글만으로 초기 유료 전환이 발생했다.
- 제안하는 가치는 명확하다. 창업자 노출 없이도 검색 가시성을 올리려는 수요가 있고, 특히 ‘코드만 하고 싶은’ 층의 불편을 정확히 찔렀다.
- 지금 병목은 제품보다 유통이다. 문제 검증은 끝났고, 다음 단계는 커뮤니티 유입을 반복 가능한 획득 루프로 바꾸는 설계에 달렸다.
출처: www.reddit.com/r/microsaas/comments/1t1pjl2/launched_las원문 보기 →
FIG-0071:1
50radar
FIG-0071:1
#0006
#0006기타 r/ClaudeAI3주 전
값싼 보조 모델로 `Claude Code` 잡일을 분리해 한도 소모를 줄인 운영 패턴
Offload cheap work from `Claude Code` to a low-cost helper model
50radar
대용량 파일 읽기와 보일러플레이트 생성만 값싼 모델로 빼고, 판단은 메인 모델에 남겼다. 프롬프트 다이어트보다 라우팅 분리가 더 잘 먹혔고 비용 대비 바로 따라 해볼 만함.
- Bash로 호출한 보조 스크립트가 파일 대량 읽기와 보일러플레이트 생성을 맡고, CLAUDE.md가 위임 기준을 고정했다.
- 3주 운영 동안 주간 Pro 한도를 한 번도 치지 않았다. 사용 습관 교정보다 작업 분리가 더 직접적으로 먹혔다.
- 문서 업데이트 작업은 약 5000토큰에서 200토큰 수준으로 줄었다. 비싼 컨텍스트를 단순 정리 작업에 덜 태운 셈.
- 보조 모델 총지출은 $0.38에 그쳤다. 반복 준비 작업이 많은 워크플로라면 절감 폭이 꽤 크다.
출처: www.reddit.com/r/ClaudeAI/comments/1t1o43w/i_gave_claude원문 보기 →
50radar
PHOTO
FIG-0061:1
#0005
#0005에이전트·도구 Hacker News · Show HN AI3주 전
`MLJAR Studio`, 대화형 분석을 로컬 노트북으로 남기는 AI 데이터 앱
`MLJAR Studio`: local AI data analyst that turns chats into notebooks
50radar
MLJAR StudioAI 데이터 앱 — 대화 분석을 .ipynb로 남김
자연어로 데이터 분석을 시키면 실행 가능한 .ipynb까지 남겨 채팅으로 끝나지 않는다. 로컬 실행, 자동 환경 구성, 내장 AutoML 조합은 실전성이 높지만 199달러 일시불이라 비용 대비 판단은 갈린다.
- 대화 결과를 재현 가능한 .ipynb로 저장한다. 생성된 Python 코드를 바로 검토·수정·재실행할 수 있어 워크플로가 남는다.
- Mac·Windows·Linux에서 로컬 Python 환경을 자동으로 만들고, 대화 중 필요한 패키지도 설치해 초기 세팅 부담을 크게 줄인다.
- 표 형식 데이터용 AutoML이 기본 탑재됐다. 분류·회귀·다중분류까지 한 앱에서 탐색과 베이스라인 모델링을 이어간다.
- 입력 범위가 넓다. CSV·Excel·Stata·Parquet 파일과 PostgreSQL·Snowflake·Databricks 같은 DB 연결을 함께 지원한다.
- 모델 선택지는 Ollama 로컬 실행, OpenAI 키 직접 연결, 자체 애드온 3갈래다. 특히 제로 데이터 이그레스를 내세운 점이 차별점이다.
출처: mljar.com/원문 보기 →
FIG-0051:1
50radar
FIG-0051:1
#0004
#0004아이디어 시그널 Hacker News · MCP Server3주 전
`SimplePDF Copilot`, 클라이언트 사이드 툴콜링으로 PDF 폼을 AI가 직접 조작
`SimplePDF Copilot`: AI PDF form filling with client-side tool calling
50radar
SimplePDF CopilotPDF AI 도구 — 브라우저에서 폼·페이지를 직접 조작
채팅으로 문서 요약하는 수준이 아니라 브라우저 안에서 필드 입력·추가·페이지 삭제까지 실행한다. PDF 원본은 안 내보내고 LLM만 갈아끼우는 구조라, 민감정보 SaaS에 바로 복제해볼 만함.
- SimplePDF는 이미 월 20만+ 사용자가 있는 제품 기반이다. 데모성 쇼케이스보다 실제 수요가 붙은 확장으로 봐야 한다.
- 개인정보 경계가 명확하다. 파싱·렌더링·필드 탐지는 전부 클라이언트에서 돌고, 모델에는 텍스트와 메시지만 보낸다.
- 기능도 검색형 Chat with PDF보다 한 단계 깊다. 필드 채우기, 필드 추가, 특정 필드 포커스, 페이지 삭제까지 바로 수행한다.
- 모델 종속성이 낮다. 기본 프록시 외에 BYOK로 클라우드 LLM을 붙일 수 있고 LM Studio로 로컬 실행도 시험 중이다.
- 구현 포인트는 iframe postMessage 기반 클라이언트 툴콜링. 에디터·캔버스·백오피스 UI에도 같은 패턴을 이식할 수 있다.
출처: copilot.simplepdf.com/?share=a7d00ad073c75a75d493228e6ff원문 보기 →
FIG-0041:1
50radar
FIG-0041:1
#0003
#0003에이전트·도구 r/ClaudeAI3주 전
`/graphify`, 코드 메모리를 넘어 범용 지식 그래프로 확장
`/graphify` turned from code memory into a general-purpose knowledge graph layer
50radar
/graphify지식 그래프 도구 — 코드·문서·이미지를 한 그래프로 질의
저장소 문맥 기억 도구로 시작했지만 실제 수요는 SQL 스키마, 노트, 논문, 회의록, 화이트보드 사진까지 한 그래프로 묶는 쪽으로 터졌다. Claude Code 보조 기능보다 범용 질의 레이어에 가깝고, 지금 바로 실험해볼 만함.
- /graphify는 저장소 전체를 읽고 Leiden 커뮤니티 탐지로 그래프를 만든다. 원본 파일 직독 대비 쿼리 토큰을 71배 줄였다.
- 출시 26일 만에 PyPI 다운로드 45만+, GitHub 스타 약 4만까지 붙었다. 배포 속도와 초기 확산력 모두 이례적이다.
- 용도는 코드에서 끝나지 않았다. SQL 스키마, Obsidian 볼트, 논문 묶음, 회의 전사, 화이트보드 사진까지 한꺼번에 넣고 질의한다.
- 핵심 기능도 바뀌었다. 단순 인덱싱보다 /graphify query "..."가 메인이 됐고, 제품 무게중심이 메모리보다 검색 쪽으로 이동했다.
출처: www.reddit.com/r/ClaudeAI/comments/1t18eeh/i_built_graph원문 보기 →
FIG-0031:1
50radar
FIG-0031:1
#0002
#0002기타 r/ClaudeAI3주 전
`Serno`, AI 답변 검증용 연구 캔버스로 피벗
`Serno` pivots from AI debate toy to research canvas for cross-model verification
50radar
SernoAI 리서치 캔버스 — 모델 답변 검증·상호반박
사람들은 두 모델 대화 장난감보다 어느 모델이 헛소리하는지 가려내는 도구로 더 많이 썼다. 그래서 질문을 쪼개 여러 모델이 조사·논쟁하는 캔버스로 갈아탔고, 중요한 리서치엔 지금 써볼 만하다.
- 초기 Roundtable은 재미용보다 모델별 환각 판별기로 소비됐다. 크로스체크 수요가 이미 뚜렷하다는 뜻이다.
- 채팅 UI는 큰 질문에 비효율적이다. 긴 스레드는 맥락을 묻고, 나란한 채팅창은 비교 비용만 키운다.
- 새 canvas 모드는 질문을 여러 각도로 분해한 뒤 모델별 조사와 상호 반박을 붙인다. 한 모델의 번듯한 오답을 덜 믿게 만든다.
- 일상 작업은 기존 채팅으로 남기고, 중요한 판단은 캔버스로 분리했다. 사용 시나리오 구분이 꽤 명확해졌다.
- 무거운 처리 상당수를 Claude가 맡고, Serno 자체도 Claude로 많이 구현했다. 시작 크레딧도 줘서 진입비용이 낮다.
출처: www.reddit.com/r/ClaudeAI/comments/1t144z1/i_got_tired_o원문 보기 →
50radar
PHOTO
FIG-0021:1
#0001
#0001에이전트·도구 Cline Releases3주 전
`Cline` `v3.82.0`, VS Code 포그라운드 터미널 복구와 모델 목록 갱신
`Cline` `v3.82.0`, VS Code Terminal Restore and Model List Refresh
50radar
ClineAI 코딩 도구 — 터미널·모델 연동이 강점
VS Code 포그라운드 터미널 지원이 돌아왔고 OpenAI·SAP AI Core·Z AI 최신 모델도 추가됐다. 매일 Cline을 쓰면 체감되지만, 당장 달려가서 올릴 급의 메이저 업데이트는 아니다.
- VS Code 포그라운드 터미널과 관련 설정을 복구했다. 터미널 붙여 쓰는 흐름이 끊겼던 사람에겐 바로 실효가 있다.
- OpenAI, SAP AI Core, Z AI 최신 모델을 추가했다. 모델 선택 폭이 넓어져 실험 환경 맞추기가 쉬워진다.
- hook 템플릿의 JSON escaping 문제를 고쳤다. 자동화 훅이 문자열 처리에서 깨지던 오류를 줄여준다.
- ripgrep 파일 검색 에러 처리를 개선했다. 검색 실패가 세션 전체 불안정으로 번지는 일을 덜어낸다.
- 문서에서 하드코딩된 모델 목록을 제거했다. 릴리스마다 문서가 뒤처지는 문제를 줄이는 정리 작업이다.
출처: github.com/cline/cline/releases/tag/v3.82.0원문 보기 →
FIG-0011:1
50radar
FIG-0011:1