This media is not supported in your browser
VIEW IN TELEGRAM
LAM: Large Avatar Model for One-shot Animatable Gaussian Head
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
Анимируемые аватары по одному изображению на гауссианах от Alibaba.
Управляются звуком и видео, поддаются редактированию-стилизации, шустро крутятся на разных девайсах
Код
Демо
Чат с аватарами - ну здесь они долго думают прежде чем ответить
#humanavatar #talkinghead #gaussian #head #mobile #realtime #lipsync #motion2video
👍5🤔2❤1👎1
Подписчики в чате продолжают улучшать FramepackStudio
На сей раз прикрутили настройки teacache.
Файлы в комментариях
Спасибо @m_franz
#image2video #text2video
На сей раз прикрутили настройки teacache.
заменить studio.py в app\studio.py . interface.py в app\modules\interface.py
Файлы в комментариях
Спасибо @m_franz
#image2video #text2video
❤7👍1
This media is not supported in your browser
VIEW IN TELEGRAM
По совету подписчиков объявляю парад FramePack генераций. Хвастайтесь в комментариях что вам удалось выжать из этого генератора
👍11❤1🔥1
Media is too big
VIEW IN TELEGRAM
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation
Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты
Код
#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d
Генерирует панорамные динамичные видео по тексту или по картинке, реконструируя 4D ассеты
Код
#image2scene #text2video #image2video #360 #panorama #4d #textto4d #imageto4d
👍6😱3
This media is not supported in your browser
VIEW IN TELEGRAM
FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios
Оживлятор персонажей по образцу движения от Tencent. Перенос движения на картинку.
На основе CogVideoX-5B
Код
Веса
#characteranimation #image2video #motion2video
Оживлятор персонажей по образцу движения от Tencent. Перенос движения на картинку.
На основе CogVideoX-5B
Код
Веса
#characteranimation #image2video #motion2video
👍7❤1
This media is not supported in your browser
VIEW IN TELEGRAM
FramePack_with_Video_Input
Форк FramePack, принимающий на вход видео и продолжающий его.
На примере первые 3 секунды видео - исходник, дальше - генерация FramePack
Ветка на официальном FramePack
#videoextension #video2video
Форк FramePack, принимающий на вход видео и продолжающий его.
На примере первые 3 секунды видео - исходник, дальше - генерация FramePack
Ветка на официальном FramePack
#videoextension #video2video
🔥20👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
А вот вам и воркфлоу генератора музыки ACE-Step
workflow
#music #text2music #musicediting #comfyui #workflow
workflow
#music #text2music #musicediting #comfyui #workflow
🔥12👍5❤1👏1
Ace-Step Audio Model Native Support in ComfyUI
Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)
А также Hidream E1 и Wan2.1 FLF2V FP8
Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод
#news #api #ComfyUI
Оказывается, в комфи есть нативная поддержка ACE-Step (официальный вокфлоу)
А также Hidream E1 и Wan2.1 FLF2V FP8
Не хотел писать, ибо сворачивают на платные рельсы, но уж напишу. На днях они сменили логотип и объявили о поддержке API всего и вся: Flux, Hailuo, MiniMax, Kling, LumaLabsAI, PixVerse, recraft, StabilityAI, Google Veo2, ideogram, GPT image-1, Pika - всего 65 нод
#news #api #ComfyUI
👍7🤷♂1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Multiverse: The First AI Multiplayer World Model
Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями
Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень
Гитхаб
Веса
#gaming #multiplayer #realtime
Первая игровая модель с мультиплеером. Модель реагирует на действия двух игроков, управляющих гоночными автомобилями
Мы уже видели много версий генеративных игровых моделей для одного игрока. Тут же авторам пришлось решить задачу взаимодействия агентов в генеративном мире, это следующий уровень
Гитхаб
Веса
#gaming #multiplayer #realtime
👍7🔥3👏1🤮1
DreamO: A Unified Framework for Image Customization
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
Персонализатор-кастомизатор изображений от ByteDance на базе Flux
Kод
Демо
HF
#personalization #referenceing #tex2image
👍11🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь в ChatGPT DeepResearch может обрабатывать репозитории Github. Отличная новость с учетом того что 3 запроса в месяц в DeepResearch дают даже бесплатным пользователям.
#news #assistant #search
#news #assistant #search
👍6😁2🔥1
HunyuanCustom: A Multimodal-Driven Architecture for Customized Video Generation
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
Мультимодальный генератор видео с кастомизацией-персонализацией по нескольким объектам.
На вход принимает текст, картинки, видео и даже звук.
Внутри LlaVa
Вопрос: сколько нужно VRAM?
Ответ: весь, готовьте H100 или ждите квантайзы с оффлоудами
Код
Веса
Попробовать (регайтесь через имейл)
ComfyUI ждем
#text2video #image2video #audio2video #video2video #personalization #multisubject
👍7❤1
Video Ocean
Проект Open Sora прокачался до коммерческого видеогенератора
Помимо обычного видео умеет создавать видео со звуком, а также картинки.
Ну и еще есть видеоэффекты
На бесплатном тарифе дают 240 токенов на месяц, этого хватит максимум на 8 видео 480p
720p и 1080p тоже есть, но разумеется дороже
#text2image #text2video #image2video
Проект Open Sora прокачался до коммерческого видеогенератора
Помимо обычного видео умеет создавать видео со звуком, а также картинки.
Ну и еще есть видеоэффекты
На бесплатном тарифе дают 240 токенов на месяц, этого хватит максимум на 8 видео 480p
720p и 1080p тоже есть, но разумеется дороже
#text2image #text2video #image2video
👍4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Dream machine Reframe
Аутпейнтинг видео от Luma labs.
расширяет границы видео под заданный формат
#outpainting #video2video
Аутпейнтинг видео от Luma labs.
расширяет границы видео под заданный формат
#outpainting #video2video
👍4❤2🔥1