telexed ~ c / c02134c6-7b4radar:50 · generative_mediaLIVE
← 피드로
NO.
#c02134c6
분야
생성형 미디어
출처
GeekNews
게재
2026-05-16 23:08:37
중요도
★ 5/10 — radar 50
`SANA-WM`, 1분 720p 비디오용 26억 파라미터 오픈소스 월드 모델
FIG-0021:1

`SANA-WM`, 1분 720p 비디오용 26억 파라미터 오픈소스 월드 모델

`SANA-WM`, a 2.6B open-source world model for 1-minute 720p video

이미지 한 장과 카메라 궤적만으로 긴 장면 이동을 제어하는 쪽에 초점이 있다. 제품 목업·게임 씬 프리뷰 실험 신호는 좋지만, 당장 SaaS 기능으로 붙이긴 무겁다.

[ 요점 ]
  1. 입력은 이미지 1장 + 6-DoF 카메라 궤적. 텍스트 영상 생성보다 장면 내부 이동 제어에 강점이 있음.
  2. Hybrid Linear Diffusion Transformer가 프레임 단위 Gated DeltaNet과 주기적 softmax를 섞어 긴 롤아웃 일관성을 잡는다.
  3. 단일 GPU에서 720p 1분 생성이 가능하다는 점은 실험 비용을 낮춘다. 실제 적용은 가중치·라이선스·추론 세팅 확인이 관건.
원문news.hada.io/topic?id=29572원문 보기 →

// related