Telegram Web Link
flux1-kontext-dev-fp8

Немасштабированные веса Контекст fp8
На 40% меньше оригинальных весов
Поддерживает E4M3FN и E5M2 форматы

#optimization #imageediting
🔥6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Amazon уже использует 1 млн роботов на складах, с ежегодным приростом в 150-200 тыс. единиц

1 робот заменяет 23 человека. Прогнозируют, что через 2-3 года машин станет больше, чем людей.
😱12👍8🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
DoppleDanger

Замена лица в реальном времени с клонированием голоса.

До 20 fps на RTX3090, это выше чем DeepLiveCam

Под капотом не inswapper128 вроде, но навряд ли что-то лучше - какой-то ReSwapper. Впрочем в репо последнего есть сравнение, посмотрите

#realtime #faceswap #deepfake
👍11🤮3👏2😁2🎃2
This media is not supported in your browser
VIEW IN TELEGRAM
BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing

проект от DeepMind, который объединяет точное управление геометрией в 3D с помощью Blender и генеративную композитинг-модель на основе предварительно обученной Stable Diffusion v2

Кода нет, кросивое

#imageediting #research
🔥8👍31
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy

А вот для видео, и код обещают

Редактирование видео с использованием прокси 3D-модели. Юзер вносит изменения в 3D-модель, и эти изменения автоматически применяются ко всем кадрам видео

Код ждем

#3d #videoediting
👍5
Framepack Studio 0.5

Не Контекстом единым.
Обновился Framepack Studio

- Добавлен MagCache, теперь используется в качестве механизма кэширования по умолчанию

- Улучшайзинг промпта через Granite LLM

- Описание картинок через Florence2 LLM


- Улучшена генерация T2V при старте с нойза (по умолчанию)

- Выведены параметры CFG

Плюс ко всему, организовали документацию

#text2video #tools
🔥9👍2
OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation

Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать

Есть веса для WAN 1.3B и WAN 14B

Код

#portraitanimation #characteranimation #lipsync
👍9👎2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Songscription

Преобразует аудиозапись в ноты и midi файлы. Это избавляет от необходимости вручную разбирать композицию.

Поддерживает транскрибацию нескольких инструментов, модель для фортепиано пока самая надёжная. В будущем планируют добавить гитарные табулатуры и аранжировки для ансамблей

Piano roll тоже может сделать

Экспорт транскрипций в форматах PDF, MIDI и MusicXML

На вход принимает youtube ссылки

Фримиум

#music2midi #music2notation #notation #audio2midi
👍24😱1
Пара новостей от универсального агента Kortix Suna

1. Даже на бесплатном тарифе теперь Sonnet 4

2. Сохам Парех своим успехом обязан Suna (если не врут)

#agent #news
😱4👍1
2025/07/13 16:18:19
Back to Top
HTML Embed Code: