telexed ~ c / e01f09bb-37cradar:40 · idea_signalLIVE
← 피드로
NO.
#e01f09bb
분야
아이디어 시그널
출처
Simon Willison
게재
2026-05-20 17:57:45
중요도
★ 4/10 — radar 40

`TokenSpeed`, LLM 출력 속도 체감용 미니 앱

`TokenSpeed` makes LLM output speed visible

30 tokens/second 같은 성능 문구를 실제 출력 애니메이션으로 확인하게 해준다. API 모델 선택보다 UX 지연 감각과 데모 기대치를 맞추는 데 바로 쓸 만함.

[ 요점 ]
  1. 5~800 tokens/second 범위를 시뮬레이션한다. 로컬 추론, 일반 API 스트리밍, 고속 출력의 체감 차이를 한 화면에서 비교 가능.
  2. 스펙표의 30 tokens/second는 감이 잘 안 온다. 실제 텍스트가 흘러나오는 속도로 보면 대기 시간이 바로 드러남.
  3. 소스가 단일 HTML로 공개되어 있다. 모델 비교 문서, 세일즈 페이지, 온보딩 화면에 붙일 수 있는 작은 아이디어.
  4. 모델 성능 벤치마크는 아니다. 구매 판단보다 스트리밍 UX, 타이핑 효과, 응답 지연 기준을 맞추는 용도에 가깝다.
원문simonwillison.net/2026/May/20/tokens-per-second/#atom-everything원문 보기 →

// related