Telegram Web Link
Media is too big
VIEW IN TELEGRAM
Lyria 2

Генератор музыки от Deepmind
Все серьезно и очень продуктово.

Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек

Записаться в вейтлист
————————

Lyria RealTime

А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)

Ну что, суно/удио бояться, батя вышел на поляну.

#music #text2music #music2music
MusicGPT

Еще один генератор-редактор музыки/песен/звука

Можно делать инструментал, можно с вокалом

Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста

И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!

Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь

На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе

#music #text2music #text2sound #music2music #tts #text2speech
Seurat: From Moving Points to Depth

Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели

Код ждем
Демо ждем

#trtacking #video2depth
Пересмотрел старый фильм, навеяло

#neuronaut_art #humor
CausVid: From Slow Bidirectional to Fast Autoregressive Video Diffusion Models

Это не просто быстрый видеогенератор, это видеогенератор в реальном времени от MIT и Adobe, основанный на WAN

9.4 кадра в секунду на одном GPU (вероятнее всего, речь о H100)

Обещают взять более качественный датасет и обучить модель с лучшим качеством

Код

#text2video #image2video #realtime
Время мемов и рефлексии

#humor
MAGI-1 4.5B

На HF появились веса средней модели видеогенератора. Вероятно, запустится на RTX 4090

#text2video #image2video
This media is not supported in your browser
VIEW IN TELEGRAM
3D inpainting

Для тех кто готов поколупаться с запуском ячеек в Google Colab

1. Запустите весь подготовительный код - каждая ячейка занимает около 10 минут и может завершиться сбоем во время выполнения, проследите чтобы каждая ячейка отработала.

2. Загрузите свой меш .ply и референсное изображение. Работает лучше всего, если изображение представляет собой измененный снимок экрана или визуализацию вашей модели. Тогда это с меньшей вероятностью приведет к появлению пробелов в модели.

3. Перемещайте и масштабируйте модель и область инпейнтинга.

реддит

#inpainting3d #colab #3dto3d
Media is too big
VIEW IN TELEGRAM
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting

Рендер сцен на гауссианах от Nvidia

В отличие от оригинального 3DGS, поддерживает фишай (очень широугольные обеъективы), корректно реконструирует сцены по видео, снятому с роллинг шаттером, позволяет воспроизводить оптические преломления и отражения

Код

#gaussian #video2scene #rendering #novelview #fisheye
Media is too big
VIEW IN TELEGRAM
В яндекс браузер прикрутили дубляж с сохранением голоса и интонаций говорящего. До сих пор все дублировалось одним механическим голосом

Пока еще работает не для всех видео, вот здесь например уже новый дубляж

#dubbing #speech2speech
Я наконец собрал свою работу за несколько лет. Нейросетки здесь не представлены.

Ищу работу/заказы

Если хотите сделать мне доброе дело, насыпьте комментов на ютубе, закиньте знакомым эйчарам.
За репост отдельная благодарность🤝

Enjoy!

#showreel
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/07/07 09:05:55
Back to Top
HTML Embed Code: