Telegram Web Link
Media is too big
VIEW IN TELEGRAM
LTXVideo 0.9.6

Обновка видеогенератора, две модели

ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата

Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг

Новое разрешение по умолчанию 1216 × 704 @ 30 FPS

воркфлоу
Гитхаб

#image2video #text2video #workflow
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians

Реконструкция головы по монокулярному видео от Toyota

Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку

Кода нет 🤩

Спасибо @m_franz

#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
FLUX.1-dev-ControlNet-Union-Pro-2.0

Поддерживает разные режимы включая canny, soft edge, depth, pose, gray

Обучен на 512x512

Демо

#controlnet #conditioning @text2image #image2image
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Avat3r: Large Animatable Gaussian Reconstruction Model for High-fidelity 3D Head Avatars

Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.

Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU

Код ждем

Спасибо @m_franz

#head #image2avatar #talkinghead #gaussian
👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Wrapper for FramePack

Kijai уже пилит.
воркфлоу
реддит
———————————
Бонус
FramePack Batch Processor

Скрипт для создания видео из каждого изображения в папке

#image2video #comfyUI
🔥41
Forwarded from Denis Sexy IT 🤖
А еще o3 прекрасно определяет где было сделано фото - попробуйте, она прям в деталях каждый фрагмент рассматривает
👍21😁1🤯1
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

Голосовой движок от Qwen
Говорит на английском и китайском
Есть контроль эмоций, контроль произношения/акцента

Работает на 4Гб VRAM

Пишут что не дотягивает до Zonos, но превосходит другие типа Spark, XTTS

Код
Веса
Видео туториал

#voicecloning #text2speech #tts
👍5
WORLDMEM: Long-term Consistent World Simulation with Memory

Очередная бродилка по генеративным игровым мирам. Но на этот раз с памятью. Он запоминает где что было, уходите, возвращаетесь - все на месте. С реалистичными сценами тоже работает. И даже демка есть. Есть и минус, она не интерактивная, действия вводятся промптом перед генерацией

Код
Демо

#gaming #image2world
👍42
В репозиторий FramePack добавлен инсталлятор для Windows

Скачиваем, распаковываем, запускаем сначала update.bat (важно), потом run.bat

спасибо @Skubidoo

Инсталлятор

#text2video #image2video #windows
6🔥5👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Stage

У Krea AI опять обновка.
Добавили функцию генерации 3D сцен

#image2scene #imageto3d #text2scene #textto3d
👍112
2025/07/08 13:41:13
Back to Top
HTML Embed Code: