Mago.Studio вышел в закрытую бету.
Напомню, это сервис стилизации видео.
В 2025, когда уже большинство сервисов умеют намного больше чем стилизовать видео
Но давайте дадим им шанс. У Mago есть онлайн интерфейс с какими-то настройками, контролнетами. И мне выдали 10К стартовых кредитов.
Если регистрировались в вейтлист, попробуйте зайти: https://app.mago.studio
Или
Записаться в бетатестеры
#video2video #styletransfer #stylization
Напомню, это сервис стилизации видео.
В 2025, когда уже большинство сервисов умеют намного больше чем стилизовать видео
Но давайте дадим им шанс. У Mago есть онлайн интерфейс с какими-то настройками, контролнетами. И мне выдали 10К стартовых кредитов.
Если регистрировались в вейтлист, попробуйте зайти: https://app.mago.studio
Или
Записаться в бетатестеры
#video2video #styletransfer #stylization
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
A3D
Гибрид 3D-редактора с генератором картинок.
- контроль позы простыми болванками
- генерация 3D-модели с помощью Gen AI (Fal.ai )
- ИИ-рендер по глубине/цвету с помощью ComfyUI или Fal.ai
- драгэндроп персонажей (тестировалось с Mixamo characters)
#3dediting #contolnet #3dtoimage #rendering
Гибрид 3D-редактора с генератором картинок.
- контроль позы простыми болванками
- генерация 3D-модели с помощью Gen AI (Fal.ai )
- ИИ-рендер по глубине/цвету с помощью ComfyUI или Fal.ai
- драгэндроп персонажей (тестировалось с Mixamo characters)
#3dediting #contolnet #3dtoimage #rendering
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Phantom
Видео по референсу, дождались, ответ Bytedance (WAN) на Gen-4 References
Теперь эта функция в опенсорсе!
Веса fp16/fp32
Гитхаб
workflow
#personalization #referencing #image2video #text2video #workflow
Видео по референсу, дождались, ответ Bytedance (WAN) на Gen-4 References
Теперь эта функция в опенсорсе!
Веса fp16/fp32
Гитхаб
workflow
#personalization #referencing #image2video #text2video #workflow
This media is not supported in your browser
VIEW IN TELEGRAM
Microsoft два месяца показывали рекламу, сделанную с применением ИИ, и никто не заметил подвоха (или всем пофиг)
Похоже, все кроме крупных планов девайсов было сгенерировано. Для этого понадобилось около тысячи запросов.
#news
Похоже, все кроме крупных планов девайсов было сгенерировано. Для этого понадобилось около тысячи запросов.
#news
FramePack-F1
Новая модель народного видеогенератора
F1 означает forward pass, модель предсказывает только будущие кадры. Также, модель обучена не накапливать ошибки.
Легче двигается камера, динамичность повысилась
FP-Studio есть в Pinokio в Community Scripts
Веса
Гитхаб
#image2video
Новая модель народного видеогенератора
F1 означает forward pass, модель предсказывает только будущие кадры. Также, модель обучена не накапливать ошибки.
Легче двигается камера, динамичность повысилась
FP-Studio есть в Pinokio в Community Scripts
Веса
Гитхаб
#image2video
Telegram
Нейронавт | Нейросети в творчестве
FramePack
Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel
480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B
Поддерживает PyTorch, xformers, flash-attn, sage-attention
Ждем однокликовый установщик для Windows, возможно даже…
Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel
480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B
Поддерживает PyTorch, xformers, flash-attn, sage-attention
Ждем однокликовый установщик для Windows, возможно даже…
Inpaint Anything for Stable Diffusion Web UI Forge
Адепты Comfy, скипайте эту новость.
расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)
#extension #inpainting #segmentation
Адепты Comfy, скипайте эту новость.
расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)
#extension #inpainting #segmentation
This media is not supported in your browser
VIEW IN TELEGRAM
LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning
Реконструкция геометрии сцены по изображению.
Хорошо моделирует невидимую на картинке часть геометрии за счет создания послойной карты точек.
На выходе меш и послойная карта глубины
Код
Демо
#imageto3d #image2scene
Реконструкция геометрии сцены по изображению.
Хорошо моделирует невидимую на картинке часть геометрии за счет создания послойной карты точек.
На выходе меш и послойная карта глубины
Код
Демо
#imageto3d #image2scene
Нейронавт | Нейросети в творчестве
FramePack-F1 Новая модель народного видеогенератора F1 означает forward pass, модель предсказывает только будущие кадры. Также, модель обучена не накапливать ошибки. Легче двигается камера, динамичность повысилась FP-Studio есть в Pinokio в Community Scripts…
А вот в FramePack Studio уже прикрутили F1
Помимо этого поддерживает промпты с таймкодами и ряд обновок есть:
- Можно задать время мягкого перехода между промптами
- Базовая поддержка LoRa: работает с большинством (всеми?) hunyuan LoRa
- Система очереди: очередь заданий не блокирует интерфейс
- Сохранение / импорт метаданных: промпт и начальные данные кодируются в выходной файл PNG, все остальные метаданные поколения сохраняются в файле JSON
- I2V и T2V: работает как с входным изображением, так и без него, что обеспечивает большую гибкость при работе со стандартными LoRA.
- Опции латентного изображения: При использовании T2V вы можете генерировать изображение на основе черного, белого, зеленого экрана или чистого шума.
Гитхаб
#image2video #text2video
Помимо этого поддерживает промпты с таймкодами и ряд обновок есть:
- Можно задать время мягкого перехода между промптами
- Базовая поддержка LoRa: работает с большинством (всеми?) hunyuan LoRa
- Система очереди: очередь заданий не блокирует интерфейс
- Сохранение / импорт метаданных: промпт и начальные данные кодируются в выходной файл PNG, все остальные метаданные поколения сохраняются в файле JSON
- I2V и T2V: работает как с входным изображением, так и без него, что обеспечивает большую гибкость при работе со стандартными LoRA.
- Опции латентного изображения: При использовании T2V вы можете генерировать изображение на основе черного, белого, зеленого экрана или чистого шума.
Гитхаб
#image2video #text2video
Media is too big
VIEW IN TELEGRAM
TesserAct: Learning 4D Embodied World Models
Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.
За глубину отвечает Marigold, обещают прикрутить NormalCrafter
Код
Веса
#imageto4d #4d #image2video #image2scene #image2normal #image2depth
Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.
За глубину отвечает Marigold, обещают прикрутить NormalCrafter
Код
Веса
#imageto4d #4d #image2video #image2scene #image2normal #image2depth
PixelHacker: Image Inpainting with Structural and Semantic Consistency
Инпейнтинг с сохранением структурной и семантической целостности
Код ждем
Демо ждем
#inpainting
Инпейнтинг с сохранением структурной и семантической целостности
Код ждем
Демо ждем
#inpainting
Media is too big
VIEW IN TELEGRAM
ICEdit (In-Context Edit): Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer
Редактор картинок текстовыми указаниями
Максимальная ширина кадра 512, высота любая.
Прожорливый, для 512×768 нужно 35 ГБ без выгрузки
Код
Демо
ComfyUI
#imageediting #workflow
Редактор картинок текстовыми указаниями
Максимальная ширина кадра 512, высота любая.
Прожорливый, для 512×768 нужно 35 ГБ без выгрузки
Код
Демо
ComfyUI
#imageediting #workflow
This media is not supported in your browser
VIEW IN TELEGRAM
Ideogram 3.0
Обновился сервис генерации картинок Ideogram
Больше реализма, точнее понимает промпты, предлагает вдвое больше стилей.
Можно загрузить до трех референсов.
Magic Fill - инпейнтинг
Extend - аутпейнтинг
Сделали интеграцию по API через Picsart, Freepik, Replicate
#text2image #referencing #imageediting #inpainting #outpainting
Обновился сервис генерации картинок Ideogram
Больше реализма, точнее понимает промпты, предлагает вдвое больше стилей.
Можно загрузить до трех референсов.
Magic Fill - инпейнтинг
Extend - аутпейнтинг
Сделали интеграцию по API через Picsart, Freepik, Replicate
#text2image #referencing #imageediting #inpainting #outpainting
Matrix3D: Large Photogrammetry Model All-in-One
Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса
Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами
Код
#photogrammetry #novelview #image2depth
Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса
Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами
Код
#photogrammetry #novelview #image2depth
Please open Telegram to view this post
VIEW IN TELEGRAM
Опубликован код инструмента для работы с изображениями ZenCtrl
Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном
Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.
Код
#conditioning #deblur #image2image #personalization #multiview #novelview #referencing
Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном
Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.
Код
#conditioning #deblur #image2image #personalization #multiview #novelview #referencing