Telegram Web Link
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Amazon уже использует 1 млн роботов на складах, с ежегодным приростом в 150-200 тыс. единиц

1 робот заменяет 23 человека. Прогнозируют, что через 2-3 года машин станет больше, чем людей.
😱12👍8🤡1
This media is not supported in your browser
VIEW IN TELEGRAM
DoppleDanger

Замена лица в реальном времени с клонированием голоса.

До 20 fps на RTX3090, это выше чем DeepLiveCam

Под капотом не inswapper128 вроде, но навряд ли что-то лучше - какой-то ReSwapper. Впрочем в репо последнего есть сравнение, посмотрите

#realtime #faceswap #deepfake
👍11🤮3👏2😁2🎃2
This media is not supported in your browser
VIEW IN TELEGRAM
BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing

проект от DeepMind, который объединяет точное управление геометрией в 3D с помощью Blender и генеративную композитинг-модель на основе предварительно обученной Stable Diffusion v2

Кода нет, кросивое

#imageediting #research
🔥8👍31
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy

А вот для видео, и код обещают

Редактирование видео с использованием прокси 3D-модели. Юзер вносит изменения в 3D-модель, и эти изменения автоматически применяются ко всем кадрам видео

Код ждем

#3d #videoediting
👍5
Framepack Studio 0.5

Не Контекстом единым.
Обновился Framepack Studio

- Добавлен MagCache, теперь используется в качестве механизма кэширования по умолчанию

- Улучшайзинг промпта через Granite LLM

- Описание картинок через Florence2 LLM


- Улучшена генерация T2V при старте с нойза (по умолчанию)

- Выведены параметры CFG

Плюс ко всему, организовали документацию

#text2video #tools
🔥9👍2
OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation

Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать

Есть веса для WAN 1.3B и WAN 14B

Код

#portraitanimation #characteranimation #lipsync
👍9👎2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Songscription

Преобразует аудиозапись в ноты и midi файлы. Это избавляет от необходимости вручную разбирать композицию.

Поддерживает транскрибацию нескольких инструментов, модель для фортепиано пока самая надёжная. В будущем планируют добавить гитарные табулатуры и аранжировки для ансамблей

Piano roll тоже может сделать

Экспорт транскрипций в форматах PDF, MIDI и MusicXML

На вход принимает youtube ссылки

Фримиум

#music2midi #music2notation #notation #audio2midi
👍21😱1
Пара новостей от универсального агента Kortix Suna

1. Даже на бесплатном тарифе теперь Sonnet 4

2. Сохам Парех своим успехом обязан Suna (если не врут)

#agent #news
😱4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan-A13B

Новая LLM от Hunyuan / Tencent
Архитектура совет экспертов (#MoE)

Оптимизирована на агентские задачи
Контекст 256K

13 B активных параметров из общего числа в 80 B

Поддержка гибридного рассуждения: позволяет выбирать между быстрым и медленным режимами мышления

Попробовать где-то здесь
API
HF
Гитхаб

#assistant #agent #reasoning
6👍4
2025/07/10 15:16:55
Back to Top
HTML Embed Code: