telexed ~ c / 21caf802-bcaradar:70 · generative_mediaLIVE
← 피드로
NO.
#21caf802
분야
생성형 미디어
출처
GitHub Trending Weekly
게재
2026-05-27 07:19:12
중요도
★ 7/10 — radar 70
`SANA`, 이미지·영상·월드모델 생성 스택으로 확장
FIG-0211:1

`SANA`, 이미지·영상·월드모델 생성 스택으로 확장

`SANA` expands into image, video, and controllable world-model generation

고해상도 이미지·영상 생성 연구 코드가 학습·추론·서빙까지 갖춘 스택으로 커졌다. 바로 앱에 붙이기보단 커스텀 생성 파이프라인 검토용으로 쓸 만함.

[ 요점 ]
  1. SANA-WM720p 1분 영상과 6-DoF 카메라 제어를 지원. 시뮬레이션·가상 촬영류 아이디어에 직접 맞는다.
  2. SANA-Video는 텍스트→영상, 이미지→영상을 지원하고 LTX2 Refiner로 2K 업스케일 경로까지 열어둠.
  3. SGLang 지원으로 OpenAI 호환 API 서빙이 가능해졌다. 모델 실험에서 제품 프로토타입까지 연결하기 쉬워짐.
  4. ComfyUI, Hugging Face, diffusers, 학습 레시피가 함께 제공된다. 단일 모델보다 생성형 미디어 플랫폼에 가깝다.
원문github.com/NVlabs/Sana원문 보기 →

// related