Telegram Web Link
This media is not supported in your browser
VIEW IN TELEGRAM
Тем временем Amazon уже использует 1 млн роботов на складах, с ежегодным приростом в 150-200 тыс. единиц

1 робот заменяет 23 человека. Прогнозируют, что через 2-3 года машин станет больше, чем людей.
This media is not supported in your browser
VIEW IN TELEGRAM
DoppleDanger

Замена лица в реальном времени с клонированием голоса.

До 20 fps на RTX3090, это выше чем DeepLiveCam

Под капотом не inswapper128 вроде, но навряд ли что-то лучше - какой-то ReSwapper. Впрочем в репо последнего есть сравнение, посмотрите

#realtime #faceswap #deepfake
This media is not supported in your browser
VIEW IN TELEGRAM
BlenderFusion: 3D-Grounded Visual Editing and Generative Compositing

проект от DeepMind, который объединяет точное управление геометрией в 3D с помощью Blender и генеративную композитинг-модель на основе предварительно обученной Stable Diffusion v2

Кода нет, кросивое

#imageediting #research
Shape-for-Motion: Precise and Consistent Video Editing with 3D Proxy

А вот для видео, и код обещают

Редактирование видео с использованием прокси 3D-модели. Юзер вносит изменения в 3D-модель, и эти изменения автоматически применяются ко всем кадрам видео

Код ждем

#3d #videoediting
Framepack Studio 0.5

Не Контекстом единым.
Обновился Framepack Studio

- Добавлен MagCache, теперь используется в качестве механизма кэширования по умолчанию

- Улучшайзинг промпта через Granite LLM

- Описание картинок через Florence2 LLM


- Улучшена генерация T2V при старте с нойза (по умолчанию)

- Выведены параметры CFG

Плюс ко всему, организовали документацию

#text2video #tools
OmniAvatar: Efficient Audio-Driven Avatar Video Generation with Adaptive Body Animation

Оживлятор персонажей по звуку речи от Alibaba.
С липсинком, естественно. Есть контроль эмоций, фона, управление жестами и их амплитудой. Даже взимодействие с объектами умеет делать

Есть веса для WAN 1.3B и WAN 14B

Код

#portraitanimation #characteranimation #lipsync
Иногда кажется, что к нейросетям уже все привыкли — ну сгенерировал текст, картинку, музыку… но вдруг находишь сервис, который за 30 секунд делает презентацию лучше, чем ты за час, — и снова вау.

Вот почему появился канал Time2Future | ИИ Медиа.
Там рассказывают не просто про технологии, а про то, как с их помощью сделать жизнь проще, а бизнес — быстрее.

В канале делятся тем, что сами проверили и используют:
👉 Как автоматизировать рутину с помощью ИИ
👉 Как выбрать из десятков генераторов тот, что реально работает
👉 Как улучшить тексты, маркетинг и даже сон (да, есть ИИ и для этого)

Ещё там регулярно публикуют сравнения, подборки, короткие и понятные объяснения, а недавно запустили каталог ИИ-сервисов — чтобы не теряться в бесконечном списке "крутых" инструментов.

Подписывайтесь, если хотите использовать нейросети не "когда-нибудь потом", а уже сегодня.
Time2Future | ИИ Медиа — это про технологии, которые работают на вас 💯

#промо
This media is not supported in your browser
VIEW IN TELEGRAM
Songscription

Преобразует аудиозапись в ноты и midi файлы. Это избавляет от необходимости вручную разбирать композицию.

Поддерживает транскрибацию нескольких инструментов, модель для фортепиано пока самая надёжная. В будущем планируют добавить гитарные табулатуры и аранжировки для ансамблей

Piano roll тоже может сделать

Экспорт транскрипций в форматах PDF, MIDI и MusicXML

На вход принимает youtube ссылки

Фримиум

#music2midi #music2notation #notation #audio2midi
Пара новостей от универсального агента Kortix Suna

1. Даже на бесплатном тарифе теперь Sonnet 4

2. Сохам Парех своим успехом обязан Suna (если не врут)

#agent #news
This media is not supported in your browser
VIEW IN TELEGRAM
Hunyuan-A13B

Новая LLM от Hunyuan / Tencent
Архитектура совет экспертов (#MoE)

Оптимизирована на агентские задачи
Контекст 256K

13 B активных параметров из общего числа в 80 B

Поддержка гибридного рассуждения: позволяет выбирать между быстрым и медленным режимами мышления

Попробовать где-то здесь
API
HF
Гитхаб

#assistant #agent #reasoning
2025/07/05 02:01:28
Back to Top
HTML Embed Code: