Telegram Web Link
Media is too big
VIEW IN TELEGRAM
MAGI-1

Новый видеогенератор длинных видео в опенсорсе
Две модели: 24B и 1.5B. Последняя вероятно запустится на RTX 4090


Попробовать можно онлайн, там насыпают кредитов

Попробовать
Веса
Код

#text2video #image2video
👍6
Media is too big
VIEW IN TELEGRAM
Vidu Q1

Обновка видеогенератора

1080p
Обещают четкую картинку, кинематографичные переходы, звуковые эффекты синхронизированные с видео

При регистрации нового аккаунта с промокодом VIDUQ1
дают 100 приветственных кредитов (мне дали 180 😕).

А за лайк видео в твиттере можно выиграть 600 кредитов и что-то там еще

[update] после трех генераций требует подписку

#text2video #image2video #video2sound #sfx
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
VisualCloze: A Universal Image Generation Framework via Visual In-Context Learning

Это Flux Fill обученный на матрицах входных изображений.

Получает на вход матрицу картинок, например 2 ряда, 2 столбца и понимает какую задачу надо выполнить. Задач можно придумать много от переноса стиля до смены времени года и генерации технических карт.

Разрешение входных изображений в матрицах при обучении 384x384 пикселя

Много примеров на гитхабе и в демоспейсе

Очень интересно какое применение вы ему найдете?

Поломал голову пока понял что он делает и как это описать. Теперь не знаю какие теги придумать.
В коментах подсказывают что это близнец In-Context-LoRA

Код
Демо
HF

#referencing #image2image #conditioning #text2image
👍5
This media is not supported in your browser
VIEW IN TELEGRAM
DIA

Голосовая модель 1.6B параметров от Nari Labs.
Создана командой из 2 человек.
Послушайте как она умеет в эмоции в сравнении с Elevenlabs и Cesame

Есть управление эмоциями и тоном через входное аудио. Модель умеет создавать смех, кашель, прочищение горла и т.д.

Код
Демо
Демо 2
Колаб
Записаться в вейтлист более мощной модели

#tts #text2speech
🔥10👍41
PartField: Learning 3D Feature Fields for Part Segmentation and Beyond

Сегментация 3D объектов на составляющие от Nvidia. Работает CAD моделями, сгенерированными моделями, реконструкциями на гауссианах

Код

#segmentation #gaussian #3dsegmentation
🔥5
CoMotion: Concurrent Multi-person 3D Motion

Отслеживание и реконструкция 3D поз нескольких человек на видео от Apple

Код
Веса

#video2pose #humanreconstruction #video2mesh
👍6
UFO²: The Desktop AgentOS

Десктопный ИИ-агент от Microsoft
Работает в песочнице, так что ваш монитор не занят.
Выбирает для взиамодействия родные API если они доступны

Код
Документация

#agent #desktop
👍4👏2
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation

Генератор видео по одной картинке от Alibaba.
С контролем камеры и движения человеков. Утверждают что именно контроль камеры и движение человеков у них лучше всех

Код ждем

#image2video #cameracontrol #motioncontrol
👍9
Бесплатная генерация для всех!

Захожу на Wan, а там такое

Генерируйте, говорят, бесплатно, а то, мол, у нас мощности простаивают. Но только пока простаивают, в Relax Mode

#news #text2image #text2video #image2video
🔥11
This media is not supported in your browser
VIEW IN TELEGRAM
DRAGON: Distributional Rewards Optimize Diffusion Generative Models

Adobe придумали метод дообучения генеративных моделей с лучшим качеством, показывают на примере генерации музыки

Кода нет, это ж Adobe

#news #music #sound
👍4
Мобильное приложение видеогенератора Vidu

Вы вообще генерируете видео на мобилах?

iOS
Android

#ios #android #mobile #text2image #image2image
👍1
2025/07/09 00:16:51
Back to Top
HTML Embed Code: