Нейронавт | Нейросети в творчестве 7522

Короче, время мемов и рефлексии

#humor

742 views08:11

EX-4D: EXtreme Viewpoint 4D Video Synthesis via Depth Watertight Mesh

Генератор видео от ByteDance с возможностью управления камерой из одноглазого (монокулярного) входного сигнала. Модель особенно эффективна при работе с экстремальными точками зрения.

Представляет собой LoRa на 1% параметров😏

Код
Демо ждем

#cameracontrol #novelview

838 viewsedited 08:41

Нейронавт | Нейросети в творчестве

3:57

This media is not supported in your browser

VIEW IN TELEGRAM

Calligrapher: Freestyle Text Image Customization

Генерация и редактирование надписей на изображении.

Умеет брать образец стиля и шрифта с картинки, и туда же вписывать новый текст.

В основе - FLUX.1-Fill-dev

Напомнило инструмент Textify из 2023. Порадуемся прогрессу за это время

Код
HF

#text2font #font #referencing #text2image

845 views09:12

Нейронавт | Нейросети в творчестве

3:22

This media is not supported in your browser

VIEW IN TELEGRAM

Describe Anything: Detailed Localized Image and Video Captioning (DAM)

Модель от NVIDIA генерирует подробные описания для заданных областей на изображениях и видео

Код
Демо

#captioning #image2text #video2text

811 views10:13

Нейронавт | Нейросети в творчестве

Please open Telegram to view this post

VIEW IN TELEGRAM

769 viewsedited 11:14

Нейронавт | Нейросети в творчестве

5:41

Media is too big

VIEW IN TELEGRAM

ThinkSound

Модель от Tongyi Lab (авторов InspireMusic и много чего еще) создаёт реалистичный звук для видео. Архитектура - цепочка рассуждений (#CoT). Необычно для генерилки звука, да? Скоро достижения языковых моделей будут везде, к этому все идет.

Модель сначала генерирует общий звуковой фон, затем улучшает качество звука конкретных объектов на экране и, наконец, редактирует всё это по текстовым указаниям пользователя

Код
Демо

Спасибо @p0lygon

#Video2sfx #foley #sfx #audioediting #video2audio #text2sfx

689 viewsedited 13:38

2025/07/05 21:05:09
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>