Нейронавт | Нейросети в творчестве 7226

MotionPro: A Precise Motion Controller for Image-to-Video Generation

Контроль движения объектов и камеры на видео от HiDream. Этот сделан на SVD

Код
Веса

#motioncontrol #cameracontrol #image2video

❤4

1.8K views13:39

Нейронавт | Нейросети в творчестве

Topaz Bloom

Новsq апскейлер изображений от Topaz Labs.

Креативное увеличениt ИИ-изображений (а другие нельзя?) до 8 раз, с добавлением деталей и в то же время точное.

5 режимов креативности от Subtle до Max, 4 вариации за раз.

сегодня до полуночи (по их времени) всем бесплатный Bloom апскейл

Напишите "Bloom Day" в комментариях к официальному твиту для раннего доступа - будет действовать до полуночи. Не забудьте открыть личку для сообщений

#upscale

❤6👍2👎2😭1

1.86K views17:56

Нейронавт | Нейросети в творчестве

Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Новый апскейлер картинок от KAIST AI. Неплохо?

Принцип работы такой:

CoZ использует уже обученную модель для повышения разрешения, разбивая процесс на несколько этапов.

На каждом этапе модель применяет текстовые подсказки, сгенерированные специальной моделью, чтобы улучшить качество изображения при увеличении.

Это позволяет достигать экстремальных уровней увеличения (например, от 16x до 256x) с сохранением деталей и качества изображения.

Под капотом - #SD3, Qwen2.5-VL-3B-Instruct и какая-то модель RAM. Говорят, что 24 ГБ должно хватать, но рекомендуют 2 GPU

Код
Демо

Спасибо @asleephidden

#upscale

👍10❤3🔥2🤔2

1.73K views08:44

Нейронавт | Нейросети в творчестве

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

Sora бесплатно

Но только в мобильном приложении Bing

Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.

Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд

IOS / Android

#mobile #iOS #android #text2video

👍4

1.62K views11:17

Нейронавт | Нейросети в творчестве

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

PlayDiffusion

Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...

Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.

Принимает на вход аудио до 50 секунд, файл до 50Мб

Попробовать на офсайте
Демо на HF
Веса
Код

Еще из новинок сервиса: липсинк

#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech

👍8

1.8K viewsedited 12:17

Нейронавт | Нейросети в творчестве

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

У Suno опять обновки

Обновленный Song Editor: редактируйте все, что только можете себе представить. Меняйте порядок, переписывайте и переделывайте свой трек фрагмент за фрагментом — прямо из формы сигнала.

#musicediting

👍8❤1

1.72K views08:12

Нейронавт | Нейросети в творчестве

1:44

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAudio S1

полностью кастомный ИИ-диктор от Fish Audio
Говорят что занял первое место на TTS-арене - не нашел

Клонирует голос за 15 секунд.
Можно выбирать любые эмоции, паузы, вздохи, шепот, крики, акценты и стили озвучки вашего текста.

Подходит для озвучки видео, аудиокниг, подкастов и так далее.

Поддерживает русский язык

#tts #text2speech #voicecloning

❤11🤔1

1.8K views08:41

Нейронавт | Нейросети в творчестве

Google AI Edge Gallery

Экспериментальное приложение Гугла для локального запуска ИИ-моделей на смартфоне

Основные возможности:

- Генерация изображений
- ИИ-чат без интернета
- Написание и редактирование кода
- Анализ изображений ("Ask Image")
- Prompt Lab с готовыми шаблонами для различных задач
- Поддержка моделей Google Gemma 3n и других
- AI Chat: участвуйте в многопользовательских беседах.
- Анализ производительности: тесты в реальном времени (TTFT, скорость декодирования, задержка).
- Загрузите свою собственную модель: протестируйте местные .taskмодели LiteRT.
- Ресурсы для разработчиков: быстрые ссылки на карточки моделей и исходный код.

Android
iOS ждем

#mobile #android #assistant #tools

❤8

1.59K views09:12

Нейронавт | Нейросети в творчестве

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

Wan2.1-VACE Native Support and Ace-Step Workflow Refined

Нативная поддержка редактора видео VACE в #ComfyUI
+ обновка воркфлоу генератора музыки Ace-Step

Воркфлоу по ссылке в заголовке

а еще они придумали как сшивать картинки в коллаж для сборки в Flux Kontext

#workflow #text2music #videoediting #imageediting #text2image #vibeediting

👍7

1.62K views09:42

Нейронавт | Нейросети в творчестве

У кого не открывается сайт pinokio.computer держите инструкцию от подписчика

Нам нужно отредактировать файл hosts, чтобы перенаправить запросы к сайту Pinokio на рабочий IP-адрес.
Сначала открываем Блокнот обязательно от имени администратора - это критически важно! Нажимаем Win+R, вводим 'notepad', и запускаем через Ctrl+Shift+Enter.
Теперь в Блокноте идем в 'Файл' - 'Открыть' и вводим путь: C:\Windows\System32\drivers\etc\hosts. Не забудьте изменить тип файлов на 'Все файлы', иначе hosts не будет виден.
В самый конец файла добавляем две строки:
3.75.10.80 portal.pinokio.computer
3.75.10.80 pinokio.computer
Сохраняем файл ! Кстати, разработчики также предоставили альтернативный адрес https://pinokio-home.netlify.app, который тоже можно использовать для загрузки приложений."

Финальный штрих - очищаем DNS-кэш. Открываем командную строку от имени администратора и выполняем: ipconfig /flushdns

Спасибо Oleg K

#tutorial

pinokio.co

AI Browser

🔥6

1.54K views12:16

Нейронавт | Нейросети в творчестве

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

Chatterbox TTS

Генератор речи в опенсорсе от Resemble AI

#SOTA в клонировании голоса без обучения? клонирует по 5-секундному образцу

Под капотом 0.5B Llama.
Уникальный контроль выразительности.
Водяные знаки на выходе.
Легкий скрипт для конверсии голоса.
Превосходит ElevenLabs.

Есть в Pinokio

Код
Демо - по русски не понимает, генерирует эльфийский
Веса

#tts #text2speech #voicecloning

👍7❤3👎1

1.67K views12:46

Нейронавт | Нейросети в творчестве

WanGP

Инструмент для запуска видеогенераторов на GPU от 6 ГБ VRAM

Позволяет генерировать видео длительностью более 10 секунд с разрешением 720p на RTX 4090 и 480p с менее чем 12 ГБ VRAM.

Поддерживает Wan, Hunyuan Video и LTV Video/ Добавили поддержку Phantom 14Bб Wan CausVidб VACE

- Поддержка старых графических процессоров (RTX 10XX, 20xx, ...)

-Интегрированные инструменты для облегчения создания видео: редактор масок, усилитель подсказок, временная и пространственная генерация

- Поддержка лор

- Очередь заданий

#tools #text2video #image2video #video2video #optimization

GitHub

GitHub - deepbeepmeep/Wan2GP: Wan 2.1 for the GPU Poor

Wan 2.1 for the GPU Poor. Contribute to deepbeepmeep/Wan2GP development by creating an account on GitHub.

❤2

1.63K views13:42

2025/07/08 13:58:36
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>