Ace-Step Audio Model Native Support in ComfyUI
Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)
А также Hidream E1 и Wan2.1 FLF2V FP8
Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод
#news #api #ComfyUI
Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)
А также Hidream E1 и Wan2.1 FLF2V FP8
Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод
#news #api #ComfyUI
This media is not supported in your browser
VIEW IN TELEGRAM
Multiverse: The First AI Multiplayer World Model
Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями
Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень
Гитхаб
Веса
#gaming #multiplayer #realtime
Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями
Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень
Гитхаб
Веса
#gaming #multiplayer #realtime
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь в ChatGPT DeepResearch может обрабатывать репозитории Github. Отличная новость с учетом того что 3 запроса в месяц в DeepResearch дают даже бесплатным пользователям.
#news #assistant #search
#news #assistant #search
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Video Ocean
Проект Open Sora прокачался до коммерческого видеогенератора
Помимо обычного видео умеет создавать видео со звуком, а также картинки.
Ну и еще есть видеоэффекты
На бесплатном тарифе дают 240 токенов на месяц, этого хватит максимум на 8 видео 480p
720p и 1080p тоже есть, но разумеется дороже
#text2image #text2video #image2video
Проект Open Sora прокачался до коммерческого видеогенератора
Помимо обычного видео умеет создавать видео со звуком, а также картинки.
Ну и еще есть видеоэффекты
На бесплатном тарифе дают 240 токенов на месяц, этого хватит максимум на 8 видео 480p
720p и 1080p тоже есть, но разумеется дороже
#text2image #text2video #image2video
This media is not supported in your browser
VIEW IN TELEGRAM
Dream machine Reframe
Аутпейнтинг видео от Luma labs.
расширяет границы видео под заданный формат
#outpainting #video2video
Аутпейнтинг видео от Luma labs.
расширяет границы видео под заданный формат
#outpainting #video2video
This media is not supported in your browser
VIEW IN TELEGRAM
TaylorSeer: From Reusing to Forecasting: Accelerating Diffusion Models with TaylorSeers
Ускорение генерации FLUX, HunyuanVideo, Wan, HiDream "в 5 раз" (на самом деле вдвое) с портерей качества меньше чем у Teacache
Код
ComfyUI
#optimization #ComfyUI
Ускорение генерации FLUX, HunyuanVideo, Wan, HiDream "в 5 раз" (на самом деле вдвое) с портерей качества меньше чем у Teacache
Код
ComfyUI
#optimization #ComfyUI
PrimitiveAnything: Human-Crafted 3D Primitive Assembly Generation with Auto-Regressive Transformer
Генератор 3d моделей из примитивов от Tencent.
Обычно 3d генераторы выдают вам кривую сетку. Тут же на вход можно подать 3D модель (а также текст, картинку) и получить аппроксимацию модели, собранную из примитивов.
Очевидное применение - генерация моделей в играх
Код
Демо
#3d #3dto3d #textto3d #imageto3d
Генератор 3d моделей из примитивов от Tencent.
Обычно 3d генераторы выдают вам кривую сетку. Тут же на вход можно подать 3D модель (а также текст, картинку) и получить аппроксимацию модели, собранную из примитивов.
Очевидное применение - генерация моделей в играх
Код
Демо
#3d #3dto3d #textto3d #imageto3d
Flex.2-preview
Превью новой версии генератора картинок от Ostris
8B параметров. Дообучаемый.
Инпейнтинг и контроль встроены (line, pose, depth)
Демо
ComfyUI
вокрфлоу
#text2image #inpainting #controlnet
Превью новой версии генератора картинок от Ostris
8B параметров. Дообучаемый.
Инпейнтинг и контроль встроены (line, pose, depth)
Демо
ComfyUI
вокрфлоу
#text2image #inpainting #controlnet
Chroma: Open-Source, Uncensored, and Built for the Community
Еще одингенератор картинок чекпойнт на базе Flux Schnell, еще в процессе тренировки
8.9B параметров
Civtiai
ComfyUI
Воркфлоу
fp8
GGUF
#comfyUI #workflow #text2image
Еще один
8.9B параметров
Civtiai
ComfyUI
Воркфлоу
fp8
GGUF
#comfyUI #workflow #text2image
Seed-Coder: Let the Code Model Curate Data for Itself
Языковая модель от ByteDance, SOTA среди опенсорсных моделей на программистских задачах
8B параметров
Есть базовая модель, Instruct и ризонер (рассуждающая)
Веса
#assistant #coding
Языковая модель от ByteDance, SOTA среди опенсорсных моделей на программистских задачах
8B параметров
Есть базовая модель, Instruct и ризонер (рассуждающая)
Веса
#assistant #coding