telexed ~ c / 1a7d92ee-212radar:60 · agent_toolLIVE
← 피드로
NO.
#1a7d92ee
분야
에이전트·도구
출처
r/LocalLLaMA
게재
2026-05-02 11:21:25
중요도
★ 6/10 — radar 60

`LDR`, 단일 `RTX 3090` 로컬 딥리서치에서 **95.7%** `SimpleQA` 달성

`LDR` pushes local deep research to **95.7%** `SimpleQA` on one `RTX 3090`

성능을 끌어올린 건 모델 자체보다 에이전트 오케스트레이션과 검색 루프다. 완전 로컬 구성도 호스티드 딥리서치 급에 근접해, 프라이버시 중시 워크플로에 지금 바로 넣어볼 만하다.

[ 요점 ]
  1. 구성은 Ollama + qwen3.6:27b + langgraph_agent 조합이다. 툴콜, 병렬 하위주제 분해, 최대 50회 반복으로 에이전트 설계 비중이 크다.
  2. 벤치마크는 SimpleQA 95.7%(287/300), xbench-DeepSearch 77.0%(77/100)다. 같은 스택의 Qwen3.5-9B보다 격차가 커 세대 개선 효과가 선명하다.
  3. 폐쇄형 지식 테스트가 아니라 검색 포함 점수다. Perplexity Deep Research 93.9%, Tavily 93.3%와 비교할 때 로컬 대안으로 경쟁력이 생겼다.
  4. 단, 샘플 수가 작고 자체 채점 노이즈도 있다. SimpleQA 오염 가능성과 중국어 벤치 편향까지 있어 절대 성능으로 받아들이면 위험하다.
  5. 보안·운영 측면도 강하다. OpenAlex·DOAJ 기반 저널 품질 평가, 사용자별 SQLCipher 암호화, 제로 텔레메트리까지 붙었다.
원문www.reddit.com/r/LocalLLaMA/comments/1t1n6o8/we_are_finally_there_qwen3627b_agentic_search_957/원문 보기 →

// related