#0412
`SANA-WM`, 1분 720p 비디오용 26억 파라미터 오픈소스 월드 모델
`SANA-WM`, a 2.6B open-source world model for 1-minute 720p video
50radar
SANA-WM오픈소스 월드 모델 — 이미지와 카메라 궤적으로 긴 영상 생성
이미지 한 장과 카메라 궤적만으로 긴 장면 이동을 제어하는 쪽에 초점이 있다. 제품 목업·게임 씬 프리뷰 실험 신호는 좋지만, 당장 SaaS 기능으로 붙이긴 무겁다.
- 입력은 이미지 1장 + 6-DoF 카메라 궤적. 텍스트 영상 생성보다 장면 내부 이동 제어에 강점이 있음.
Hybrid Linear Diffusion Transformer가 프레임 단위Gated DeltaNet과 주기적 softmax를 섞어 긴 롤아웃 일관성을 잡는다.- 단일 GPU에서 720p 1분 생성이 가능하다는 점은 실험 비용을 낮춘다. 실제 적용은 가중치·라이선스·추론 세팅 확인이 관건.
출처: news.hada.io/topic?id=29572원문 보기 →