Media is too big
VIEW IN TELEGRAM
LTXVideo 0.9.6
Обновка видеогенератора, две модели
ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата
Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг
Новое разрешение по умолчанию 1216 × 704 @ 30 FPS
воркфлоу
Гитхаб
#image2video #text2video #workflow
Обновка видеогенератора, две модели
ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата
Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг
Новое разрешение по умолчанию 1216 × 704 @ 30 FPS
воркфлоу
Гитхаб
#image2video #text2video #workflow
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians
Реконструкция головы по монокулярному видео от Toyota
Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку
Кода нет🤩
Спасибо @m_franz
#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Реконструкция головы по монокулярному видео от Toyota
Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку
Кода нет
Спасибо @m_franz
#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2
FLUX.1-dev-ControlNet-Union-Pro-2.0
Поддерживает разные режимы включая canny, soft edge, depth, pose, gray
Обучен на 512x512
Демо
#controlnet #conditioning @text2image #image2image
Поддерживает разные режимы включая canny, soft edge, depth, pose, gray
Обучен на 512x512
Демо
#controlnet #conditioning @text2image #image2image
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Avat3r: Large Animatable Gaussian Reconstruction Model for High-fidelity 3D Head Avatars
Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.
Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU
Код ждем
Спасибо @m_franz
#head #image2avatar #talkinghead #gaussian
Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.
Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU
Код ждем
Спасибо @m_franz
#head #image2avatar #talkinghead #gaussian
👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Wrapper for FramePack
Kijai уже пилит.
воркфлоу
реддит
———————————
Бонус
FramePack Batch Processor
Скрипт для создания видео из каждого изображения в папке
#image2video #comfyUI
Kijai уже пилит.
воркфлоу
реддит
———————————
Бонус
FramePack Batch Processor
Скрипт для создания видео из каждого изображения в папке
#image2video #comfyUI
🔥4❤1
Forwarded from Denis Sexy IT 🤖
А еще o3 прекрасно определяет где было сделано фото - попробуйте, она прям в деталях каждый фрагмент рассматривает
👍2❤1😁1🤯1
NormalCrafter: Learning Temporally Consistent Normals from Video Diffusion Priors
Генератор нормалей для видео, которые наконец-то не кипят и не трясутся
Демо
Код
#video2normal
Генератор нормалей для видео, которые наконец-то не кипят и не трясутся
Демо
Код
#video2normal
👍8🍌1
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
Голосовой движок от Qwen
Говорит на английском и китайском
Есть контроль эмоций, контроль произношения/акцента
Работает на 4Гб VRAM
Пишут что не дотягивает до Zonos, но превосходит другие типа Spark, XTTS
Код
Веса
Видео туториал
#voicecloning #text2speech #tts
Голосовой движок от Qwen
Говорит на английском и китайском
Есть контроль эмоций, контроль произношения/акцента
Работает на 4Гб VRAM
Пишут что не дотягивает до Zonos, но превосходит другие типа Spark, XTTS
Код
Веса
Видео туториал
#voicecloning #text2speech #tts
GitHub
GitHub - index-tts/index-tts: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System
An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System - index-tts/index-tts
👍5
WORLDMEM: Long-term Consistent World Simulation with Memory
Очередная бродилка по генеративным игровым мирам. Но на этот раз с памятью. Он запоминает где что было, уходите, возвращаетесь - все на месте. С реалистичными сценами тоже работает. И даже демка есть. Есть и минус, она не интерактивная, действия вводятся промптом перед генерацией
Код
Демо
#gaming #image2world
Очередная бродилка по генеративным игровым мирам. Но на этот раз с памятью. Он запоминает где что было, уходите, возвращаетесь - все на месте. С реалистичными сценами тоже работает. И даже демка есть. Есть и минус, она не интерактивная, действия вводятся промптом перед генерацией
Код
Демо
#gaming #image2world
👍4❤2
В репозиторий FramePack добавлен инсталлятор для Windows
Скачиваем, распаковываем, запускаем сначала update.bat (важно), потом run.bat
спасибо @Skubidoo
Инсталлятор
#text2video #image2video #windows
Скачиваем, распаковываем, запускаем сначала update.bat (важно), потом run.bat
спасибо @Skubidoo
Инсталлятор
#text2video #image2video #windows
❤6🔥5👍1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Krea Stage
У Krea AI опять обновка.
Добавили функцию генерации 3D сцен
#image2scene #imageto3d #text2scene #textto3d
У Krea AI опять обновка.
Добавили функцию генерации 3D сцен
#image2scene #imageto3d #text2scene #textto3d
👍11❤2