Telegram Web Link
This media is not supported in your browser
VIEW IN TELEGRAM
4Real-Video-V2: Fused View-Time Attention and Feedforward Reconstruction for 4D Scene Generation

SOTA в генерации и реконструкция видео в 4D от Snap и KAUST, в списке авторов русские фамилии.

Может как воссоздать сцену по мультиракурсному видео, так и сгенерировать по тексту

Показывает изменения сцены во времени и пространстве, как если бы это было живое 4D изображение.

Под капотом гауссианы и еще что-то

Кода нет, ждем в снэпчате?

#4D #textto4d #videoto4D #gaussian #novelview #rendering #research
Media is too big
VIEW IN TELEGRAM
4D-LRM: Large Space-Time Reconstruction Model From and To Any View at Any Time

И тут же подобная работа от Adobe С КОДОМ‼️

Модель способна принимать на вход ограниченное количество изображений объекта с разных ракурсов и моментов времени и создавать из них новые комбинации ракурсов и моментов времени.

Объединяет пространство и время, представляя объект как облако 4D гауссиан

Обрабатывает 24 кадра за менее чем 1,5 секунды на одном GPU A100

Но разрешение, похоже, всего 256 x 256 (а, вот почему с кодом)

Код должен быть, проверить не могу

#4D #videoto4D #gaussian #novelview #rendering #imageto4d
Forge жив! (наверно)

В репозитории появляются новые коммиты.
Теперь есть поддержка Chroma - свободного от цензуры Flux Schnell с PONYманием анатомии
Поддержка fp8 здесь
Как поженить с лорами - здесь и здесь

#text2image #forge
Matrix-Game: Interactive World Foundation Model

Еще одна модель для создания управляемых "игровых" миров с кодом. Обучена генерировать игровые сцены на основе изображений и пользовательских действий

Обучен на майнкрафте, но может и в другие игры

Код

#scene #image2video #world
Объявляю сброс мемов, накопилось

#humor
2025/06/29 00:15:10
Back to Top
HTML Embed Code: