Telegram Web Link
Nunchaku v0.2.0

Обновился движок для запуска 4-битных диффузных моделей
Добавлена поддержка нескольких лор и контролнета

На 3060 12gb Flux Dev выдает 1024x1024 30 шагов euler за 14-15 секунд

Код
Демо
ComfyUI
Туториал (youtube)

#text2image #optimization #tutorial
👍125
Media is too big
VIEW IN TELEGRAM
FramePack

Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel

480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B

Поддерживает PyTorch, xformers, flash-attn, sage-attention

Ждем однокликовый установщик для Windows, возможно даже завтра

Код

#optimization #text2video #image2video
24🔥2👍1🤔1
InstantCharacter : Personalize Any Characters with a Scalable Diffusion Transformer Framework

Персонализотор картинок по одному образцу от Tencent

Прикручено к Flux, работает с лорами

Код
Демо

#personalization #text2image #image2image
🔥10
Media is too big
VIEW IN TELEGRAM
LTXVideo 0.9.6

Обновка видеогенератора, две модели

ltxv-2b-0.9.6-dev-04-25 - улучшили качество
ltxv-2b-0.9.6-distilled-04-25 - быстрый как саморазборка старшипа в верхних слоях атмосферы, в 15 раз быстрее недистиллированного брата

Сэмплирование за 8 (рекомендовано), 4, 2 или 1 шаг

Новое разрешение по умолчанию 1216 × 704 @ 30 FPS

воркфлоу
Гитхаб

#image2video #text2video #workflow
👍15
This media is not supported in your browser
VIEW IN TELEGRAM
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians

Реконструкция головы по монокулярному видео от Toyota

Модель предсказывает меш и натягивает на него набор гауссиан так чтобы на рендере получить исходную картинку

Кода нет 🤩

Спасибо @m_franz

#head #image2head #video2head #videoto4d #video2mesh #image2mesh #gaussian
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62
FLUX.1-dev-ControlNet-Union-Pro-2.0

Поддерживает разные режимы включая canny, soft edge, depth, pose, gray

Обучен на 512x512

Демо

#controlnet #conditioning @text2image #image2image
🔥9
This media is not supported in your browser
VIEW IN TELEGRAM
Avat3r: Large Animatable Gaussian Reconstruction Model for High-fidelity 3D Head Avatars

Анимируемый 3D-аватар головы по 4 входным портретам за один прямой проход от Meta Reality Labs.

Создается за несколько минут, далее анимируется интерактивно, ~8fps на RTX 3090 GPU

Код ждем

Спасибо @m_franz

#head #image2avatar #talkinghead #gaussian
👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI Wrapper for FramePack

Kijai уже пилит.
воркфлоу
реддит
———————————
Бонус
FramePack Batch Processor

Скрипт для создания видео из каждого изображения в папке

#image2video #comfyUI
🔥41
Forwarded from Denis Sexy IT 🤖
А еще o3 прекрасно определяет где было сделано фото - попробуйте, она прям в деталях каждый фрагмент рассматривает
👍21😁1🤯1
2025/07/10 12:39:39
Back to Top
HTML Embed Code: