Нейронавт | Нейросети в творчестве 7218

Кажется в мемах про ИИ какой-то ограниченный набор тем

- ИИ такой тупой!
- ИИ умнее людей
- восстание машин

Накидывайте еще

#humor

1.8K views12:48

Нейронавт | Нейросети в творчестве

1:08

Media is too big

VIEW IN TELEGRAM

FlyMy AI выпустили мультимодального агента под топовые медиа AI-задачи.

FlyMy Agent M1 — это интеллектуальный API, покрывающий сотни юзкейсов одним запросом. Агент сам выбирает лучшую модель из десятков лучших сетей и выдаёт лучший результат по цене и качеству, обходя OpenAI и Bagel.

Разработчики запустили чат для тестов, где можно посмотреть, какая сеть использовалась, кастомизировать поведение и даже обучать свои LoRA-модели.

Доступны:
— генерация изображений,
— смена внешности и одежды,
— создание видео с анимацией.

Фишка — сохранение идентичности: если сгенерируете видео с собой — это действительно будете вы.

До 14 июня — расширенный бесплатный период: до 50 изображений и 5 минут видео. Успей протестировать!

👉 Потыкать с сегодняшнего дня можно тут

#промо

1.9K views07:08

Нейронавт | Нейросети в творчестве

SkyReels-V2-T2V-14B-720P-VACE-GGUF

квантизованная версия универсального видеогенератора-редактора

воркфлоу

#text2video #image2video #videoediting #personalization #gguf #workflow

huggingface.co

QuantStack/SkyReels-V2-T2V-14B-720P-VACE-GGUF · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

1.6K views09:23

Нейронавт | Нейросети в творчестве

1:56

Media is too big

VIEW IN TELEGRAM

Оdyssey

Публичная демка видеогенератора миров в реальном времени в браузере.

Я специально крутился, ходил и оборачивался чтобы убедиться что он помнит что находится за спиной. Это-то он помнит но посмотрите как ни с того ни с сего корежит дверь на 1:08

Чем дальше уходишь от начальной точки, тем с большей неохотой движок позволяет тебе идти. Как будто резина натянута.

И еще. Набор миров один и тот же. Я несколько раз заходил, перещелкивал и миры и попадал на одни и те же несколько раз. Есть большие сомнения что миры сочинены на ходу. Сделаем скидку на то что это демо, ждем чего-то понятного и практичного

#realtime #scene #world

1.6K views10:06

Нейронавт | Нейросети в творчестве

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

Плагин для улучшение качества стилизации изображений с помощью диффузионных моделей.

Для каждого стиля сначала независимо тренируются модули LoRA , а затем уже обученный модуль согласованности применяется к стилизованным изображениям

Код
Демо
Веса - в том числе пачка лор

#personalization #styletrasfer #stylization #lora #plugin

1.8K viewsedited 11:06

Нейронавт | Нейросети в творчестве

1:10

Media is too big

VIEW IN TELEGRAM

ATI: Any Trajectory Instruction for Controllable Video Generation

Контроль движения объектов и камеры на видео от ByteDance

Прикручено к Wan2.1 14B

Код
Веса
Веса Kijai
ComfyUI
воркфлоу

#motioncontrol #cameracontrol #image2video

1.7K views12:51

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

MotionPro: A Precise Motion Controller for Image-to-Video Generation

Контроль движения объектов и камеры на видео от HiDream. Этот сделан на SVD

Код
Веса

#motioncontrol #cameracontrol #image2video

1.8K views13:39

Нейронавт | Нейросети в творчестве

Topaz Bloom

Новsq апскейлер изображений от Topaz Labs.

Креативное увеличениt ИИ-изображений (а другие нельзя?) до 8 раз, с добавлением деталей и в то же время точное.

5 режимов креативности от Subtle до Max, 4 вариации за раз.

сегодня до полуночи (по их времени) всем бесплатный Bloom апскейл

Напишите "Bloom Day" в комментариях к официальному твиту для раннего доступа - будет действовать до полуночи. Не забудьте открыть личку для сообщений

#upscale

1.8K views17:56

Нейронавт | Нейросети в творчестве

Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Новый апскейлер картинок от KAIST AI. Неплохо?

Принцип работы такой:

CoZ использует уже обученную модель для повышения разрешения, разбивая процесс на несколько этапов.

На каждом этапе модель применяет текстовые подсказки, сгенерированные специальной моделью, чтобы улучшить качество изображения при увеличении.

Это позволяет достигать экстремальных уровней увеличения (например, от 16x до 256x) с сохранением деталей и качества изображения.

Под капотом - #SD3, Qwen2.5-VL-3B-Instruct и какая-то модель RAM. Говорят, что 24 ГБ должно хватать, но рекомендуют 2 GPU

Код
Демо

Спасибо @asleephidden

#upscale

1.7K views08:44

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Sora бесплатно

Но только в мобильном приложении Bing

Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.

Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд

IOS / Android

#mobile #iOS #android #text2video

1.6K views11:17

Нейронавт | Нейросети в творчестве

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

PlayDiffusion

Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...

Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.

Принимает на вход аудио до 50 секунд, файл до 50Мб

Попробовать на офсайте
Демо на HF
Веса
Код

Еще из новинок сервиса: липсинк

#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech

1.8K viewsedited 12:17

Нейронавт | Нейросети в творчестве

0:47

This media is not supported in your browser

VIEW IN TELEGRAM

У Suno опять обновки

Обновленный Song Editor: редактируйте все, что только можете себе представить. Меняйте порядок, переписывайте и переделывайте свой трек фрагмент за фрагментом — прямо из формы сигнала.

#musicediting

1.7K views08:12

Нейронавт | Нейросети в творчестве

1:45

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAudio S1

полностью кастомный ИИ-диктор от Fish Audio
Говорят что занял первое место на TTS-арене - не нашел

Клонирует голос за 15 секунд.
Можно выбирать любые эмоции, паузы, вздохи, шепот, крики, акценты и стили озвучки вашего текста.

Подходит для озвучки видео, аудиокниг, подкастов и так далее.

Поддерживает русский язык

#tts #text2speech #voicecloning

1.8K views08:41

2025/07/02 02:11:34
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>