Nunchaku v0.2.0
Обновился движок для запуска 4-битных диффузных моделей
Добавлена поддержка нескольких лор и контролнета
На 3060 12gb Flux Dev выдает 1024x1024 30 шагов euler за 14-15 секунд
Код
Демо
ComfyUI
Туториал (youtube)
#text2image #optimization #tutorial
Обновился движок для запуска 4-битных диффузных моделей
Добавлена поддержка нескольких лор и контролнета
На 3060 12gb Flux Dev выдает 1024x1024 30 шагов euler за 14-15 секунд
Код
Демо
ComfyUI
Туториал (youtube)
#text2image #optimization #tutorial
👍12❤5
Media is too big
VIEW IN TELEGRAM
FramePack
Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel
480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B
Поддерживает PyTorch, xformers, flash-attn, sage-attention
Ждем однокликовый установщик для Windows, возможно даже завтра
Код
#optimization #text2video #image2video
Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel
480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B
Поддерживает PyTorch, xformers, flash-attn, sage-attention
Ждем однокликовый установщик для Windows, возможно даже завтра
Код
#optimization #text2video #image2video
❤24🔥2👍1🤔1
Wan2.1-FLF2V-14B
Выпустили модель генерации видео по первому и последнему кадру, 14B параметров
Только 720p
Веса
Веса у Kijai
Гитхаб
Kijai Workflow
#image2video
Выпустили модель генерации видео по первому и последнему кадру, 14B параметров
Только 720p
Веса
Веса у Kijai
Гитхаб
Kijai Workflow
#image2video
🔥23
InstantCharacter : Personalize Any Characters with a Scalable Diffusion Transformer Framework
Персонализотор картинок по одному образцу от Tencent
Прикручено к Flux, работает с лорами
Код
Демо
#personalization #text2image #image2image
Персонализотор картинок по одному образцу от Tencent
Прикручено к Flux, работает с лорами
Код
Демо
#personalization #text2image #image2image
🔥10
Media is too big
VIEW IN TELEGRAM
LTXVideo 0.9.6
Обновка видеогенератора, две модели
ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата
Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг
Новое разрешение по умолчанию 1216 × 704 @ 30 FPS
воркфлоу
Гитхаб
#image2video #text2video #workflow
Обновка видеогенератора, две модели
ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата
Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг
Новое разрешение по умолчанию 1216 × 704 @ 30 FPS
воркфлоу
Гитхаб
#image2video #text2video #workflow
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians
Реконструкция головы по монокулярному видео от Toyota
Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку
Кода нет🤩
Спасибо @m_franz
#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Реконструкция головы по монокулярному видео от Toyota
Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку
Кода нет
Спасибо @m_franz
#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6❤2
FLUX.1-dev-ControlNet-Union-Pro-2.0
Поддерживает разные режимы включая canny, soft edge, depth, pose, gray
Обучен на 512x512
Демо
#controlnet #conditioning @text2image #image2image
Поддерживает разные режимы включая canny, soft edge, depth, pose, gray
Обучен на 512x512
Демо
#controlnet #conditioning @text2image #image2image
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Avat3r: Large Animatable Gaussian Reconstruction Model for High-fidelity 3D Head Avatars
Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.
Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU
Код ждем
Спасибо @m_franz
#head #image2avatar #talkinghead #gaussian
Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.
Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU
Код ждем
Спасибо @m_franz
#head #image2avatar #talkinghead #gaussian
👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Wrapper for FramePack
Kijai уже пилит.
воркфлоу
реддит
———————————
Бонус
FramePack Batch Processor
Скрипт для создания видео из каждого изображения в папке
#image2video #comfyUI
Kijai уже пилит.
воркфлоу
реддит
———————————
Бонус
FramePack Batch Processor
Скрипт для создания видео из каждого изображения в папке
#image2video #comfyUI
🔥4❤1
Forwarded from Denis Sexy IT 🤖
А еще o3 прекрасно определяет где было сделано фото - попробуйте, она прям в деталях каждый фрагмент рассматривает
👍2❤1😁1🤯1