Telegram Web Link
ImmerseGen: Agent-Guided Immersive World Generation with Alpha-Textured Proxies

Разработка ByteDance.
Создаёт 3D-миры по текстовым описаниям для виртуальной реальности. Сначала формируется базовая местность, а затем добавляются объекты.

Под капотом агенты, работающие на основе визуальных языковых моделей

Код ждем

#VR #vlm #text2scene #text2world
Spline Path Control v2

Контроль движения сплайнами без лишнего промпинга.

Полученное движение предлагают использовать как управляющее видео для VACE

Народное творчество, сделано в DeepSeek + Google Gemini, пользуйтесь пока не сломалось и пока автор не разорился

Код
Попробовать онлайн
воркфлоу

#workflow #motioncontrol #image2video
Media is too big
VIEW IN TELEGRAM
Virtual Community: An Open World for Humans, Robots, and Society

Cоздание интерактивных и масштабируемых симуляций открытых миров, где используются реальные географические данные и компьютерные модели для имитации жизни людей и роботов.

Давайте думать, подсказывайте как сделать-то по красоте это можно использовать?

Код

#world #robot #simulation #interacton #HRI
MultiTalk: Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation

Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.

- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи

Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100

#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
2025/06/29 05:38:04
Back to Top
HTML Embed Code: