Telegram Web Link
Ace-Step Audio Model Native Support in ComfyUI

Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)

А также Hidream E1 и Wan2.1 FLF2V FP8

Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод

#news #api #ComfyUI
This media is not supported in your browser
VIEW IN TELEGRAM
Multiverse: The First AI Multiplayer World Model

Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями

Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень

Гитхаб
Веса

#gaming #multiplayer #realtime
DreamO: A Unified Framework for Image Customization

Персонализатор-кастомизатор изображений от ByteDance на базе Flux

Kод
Демо
HF

#personalization #referenceing #tex2image
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь в ChatGPT DeepResearch может обрабатывать репозитории Github. Отличная новость с учетом того что 3 запроса в месяц в DeepResearch дают даже бесплатным пользователям.

#news #assistant #search
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation

Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa

Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами

Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем

#text2video #image2video #audio2video #video2video #personalization #multisubject
Video Ocean

Проект Open Sora прокачался до коммерческого видеогенератора

Помимо обычного видео умеет создавать видео со звуком, а также картинки.
Ну и еще есть видеоэффекты

На бесплатном тарифе дают 240 токенов на месяц, этого хватит максимум на 8 видео 480p

720p и 1080p тоже есть, но разумеется дороже

#text2image #text2video #image2video
This media is not supported in your browser
VIEW IN TELEGRAM
Dream machine Reframe

Аутпейнтинг видео от Luma labs.
расширяет границы видео под заданный формат

#outpainting #video2video
This media is not supported in your browser
VIEW IN TELEGRAM
TaylorSeer: From Reusing to Forecasting: Accelerating Diffusion Models with TaylorSeers

Ускорение генерации FLUX, HunyuanVideo, Wan, HiDream "в 5 раз" (на самом деле вдвое) с портерей качества меньше чем у Teacache

Код
ComfyUI

#optimization #ComfyUI
PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer

Генератор 3d моделей из примитивов от Tencent.
Обычно 3d генераторы выдают вам кривую сетку. Тут же на вход можно подать 3D модель (а также текст, картинку) и получить аппроксимацию модели, собранную из примитивов.

Очевидное применение - генерация моделей в играх

Код
Демо

#3d #3dto3d #textto3d #imageto3d
Flex.2-preview

Превью новой версии генератора картинок от Ostris

8B параметров. Дообучаемый.
Инпейнтинг и контроль встроены (line, pose, depth)

Демо
ComfyUI
вокрфлоу

#text2image #inpainting #controlnet
Chroma: Open-Source, Uncensored, and Built for the Community

Еще один генератор картинок чекпойнт на базе Flux Schnell, еще в процессе тренировки

8.9B параметров

Civtiai
ComfyUI
Воркфлоу
fp8
GGUF

#comfyUI #workflow #text2image
Seed-Coder: Let the Code Model Curate Data for Itself

Языковая модель от ByteDance, SOTA среди опенсорсных моделей на программистских задачах

8B параметров

Есть базовая модель, Instruct и ризонер (рассуждающая)

Веса

#assistant #coding
2025/07/05 12:21:22
Back to Top
HTML Embed Code: