Нейронавт | Нейросети в творчестве 6968 - Telegram Web

Telegram Web Link

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Mago.Studio вышел в закрытую бету.

Напомню, это сервис стилизации видео.
В 2025, когда уже большинство сервисов умеют намного больше чем стилизовать видео

Но давайте дадим им шанс. У Mago есть онлайн интерфейс с какими-то настройками, контролнетами. И мне выдали 10К стартовых кредитов.

Если регистрировались в вейтлист, попробуйте зайти: https://app.mago.studio

Или

Записаться в бетатестеры

#video2video #styletransfer #stylization

1.9K views11:20

Нейронавт | Нейросети в творчестве

AI Runner

Локальная среда запуска нейросеток - языковых моделей, генератов текста, видео, речи.

Обещают легкую установку (Docker), свободу от зависимостей (со сладкого не слезу 🤩), систему плагинов и прочие плюшки вплоть до импорта в ваш питон-проект в виде библиотеки

#tools

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

1.8K views11:46

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

A3D

Гибрид 3D-редактора с генератором картинок.

- контроль позы простыми болванками
- генерация 3D-модели с помощью Gen AI (Fal.ai )
- ИИ-рендер по глубине/цвету с помощью ComfyUI или Fal.ai
- драгэндроп персонажей (тестировалось с Mixamo characters)

#3dediting #contolnet #3dtoimage #rendering

2.0K views12:16

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Deep-Live-Cam

Однокликовая замена лица на видео в реальном времени.

Можно сохранить оригинальный рот, можно заменять одновременно несколько лиц.

Под капотом все те же Insightface / GPFGAN / inswapper_128 но почемуто хайпанула

Есть коммерческая версия

Код
HF репо

#faceswap #realtime

1.9K viewsedited 13:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Phantom

Видео по референсу, дождались, ответ Bytedance (WAN) на Gen-4 References
Теперь эта функция в опенсорсе!

Веса fp16/fp32
Гитхаб
workflow

#personalization #referencing #image2video #text2video #workflow

2.0K viewsedited 14:17

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Microsoft два месяца показывали рекламу, сделанную с применением ИИ, и никто не заметил подвоха (или всем пофиг)

Похоже, все кроме крупных планов девайсов было сгенерировано. Для этого понадобилось около тысячи запросов.

#news

1.9K views15:18

Нейронавт | Нейросети в творчестве

FramePack-F1

Новая модель народного видеогенератора

F1 означает forward pass, модель предсказывает только будущие кадры. Также, модель обучена не накапливать ошибки.
Легче двигается камера, динамичность повысилась

FP-Studio есть в Pinokio в Community Scripts

Веса
Гитхаб

#image2video

Нейронавт | Нейросети в творчестве

FramePack

Метод генерации длинных (1000+ кадров) видео от звезды опенсорсных моделей lllyasviel

480p @ 30 FPS на 6 ГБ VRAM, Hunyuan 13B

Поддерживает PyTorch, xformers, flash-attn, sage-attention

Ждем однокликовый установщик для Windows, возможно даже…

1.8K viewsedited 10:44

Нейронавт | Нейросети в творчестве

Inpaint Anything for Stable Diffusion Web UI Forge

Адепты Comfy, скипайте эту новость.

расширение для Forge, позволяющее делать инпейнтинг по маске из SAM (на выбор ряд моделей, в том числе SAM 2)

#extension #inpainting #segmentation

1.8K views11:33

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

LaRI: Layered Ray Intersections for Single-view 3D Geometric Reasoning

Реконструкция геометрии сцены по изображению.
Хорошо моделирует невидимую на картинке часть геометрии за счет создания послойной карты точек.

На выходе меш и послойная карта глубины

Код
Демо

#imageto3d #image2scene

1.7K views12:42

Нейронавт | Нейросети в творчестве

Нейронавт | Нейросети в творчестве

FramePack-F1 Новая модель народного видеогенератора F1 означает forward pass, модель предсказывает только будущие кадры. Также, модель обучена не накапливать ошибки. Легче двигается камера, динамичность повысилась FP-Studio есть в Pinokio в Community Scripts…

А вот в FramePack Studio уже прикрутили F1

Помимо этого поддерживает промпты с таймкодами и ряд обновок есть:

- Можно задать время мягкого перехода между промптами
- Базовая поддержка LoRa: работает с большинством (всеми?) hunyuan LoRa
- Система очереди: очередь заданий не блокирует интерфейс
- Сохранение / импорт метаданных: промпт и начальные данные кодируются в выходной файл PNG, все остальные метаданные поколения сохраняются в файле JSON
- I2V и T2V: работает как с входным изображением, так и без него, что обеспечивает большую гибкость при работе со стандартными LoRA.
- Опции латентного изображения: При использовании T2V вы можете генерировать изображение на основе черного, белого, зеленого экрана или чистого шума.

Гитхаб

#image2video #text2video

1.8K views13:11

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

TesserAct: Learning 4D Embodied World Models

Модель предсказывает развитие событий в 3D сцене по входному изображению и текстовому промпту, описывающему действие. На выходе видео RGB + глубина и нормали.

За глубину отвечает Marigold, обещают прикрутить NormalCrafter

Код
Веса

#imageto4d #4d #image2video #image2scene #image2normal #image2depth

1.7K viewsedited 13:41

Нейронавт | Нейросети в творчестве

PixelHacker: Image Inpainting with Structural and Semantic Consistency

Инпейнтинг с сохранением структурной и семантической целостности

Код ждем
Демо ждем

#inpainting

1.5K views14:17

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

ICEdit (In-Context Edit): Enabling Instructional Image Editing with In-Context Generation in Large Scale Diffusion Transformer

Редактор картинок текстовыми указаниями

Максимальная ширина кадра 512, высота любая.
Прожорливый, для 512×768 нужно 35 ГБ без выгрузки

Код
Демо
ComfyUI

#imageediting #workflow

1.5K viewsedited 14:47

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Ideogram 3.0

Обновился сервис генерации картинок Ideogram

Больше реализма, точнее понимает промпты, предлагает вдвое больше стилей.

Можно загрузить до трех референсов.

Magic Fill - инпейнтинг

Extend - аутпейнтинг

Сделали интеграцию по API через Picsart, Freepik, Replicate

#text2image #referencing #imageediting #inpainting #outpainting

1.6K views15:20

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

This media is not supported in your browser

VIEW IN TELEGRAM

Matrix3D: Large Photogrammetry Model All-in-One

Единая модель фотограмметрии от Apple, выполняющая оценку ракурса, глубины и синтез нового ракурса

Сгенерированные новые ракурсы предлагают использовать для реконструкции сцены гауссианами

Код

#photogrammetry #novelview #image2depth

1.6K views15:48

Нейронавт | Нейросети в творчестве

Please open Telegram to view this post

VIEW IN TELEGRAM

1.7K viewsedited 06:09

Нейронавт | Нейросети в творчестве

Опубликован код инструмента для работы с изображениями ZenCtrl

Разрешение до 1024×1024, уже работают над 1500х1500 и больше, работают над агентским и видеопайплайном

Лучше всего работает с объектами. С людьми - ограниченно. Плохо умеет в иллюстации. Ибо обучен на бедном датасете. В будущем улучшат.

Код

#conditioning #deblur #image2image #personalization #multiview #novelview #referencing

1.6K viewsedited 09:16

2025/07/06 06:19:26
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>