Telegram Web Link
Кажется в мемах про ИИ какой-то ограниченный набор тем

- ИИ такой тупой!
- ИИ умнее людей
- восстание машин

Накидывайте еще

#humor
Media is too big
VIEW IN TELEGRAM
FlyMy AI выпустили мультимодального агента под топовые медиа AI-задачи.

FlyMy Agent M1 — это интеллектуальный API, покрывающий сотни юзкейсов одним запросом. Агент сам выбирает лучшую модель из десятков лучших сетей и выдаёт лучший результат по цене и качеству, обходя OpenAI и Bagel.

Разработчики запустили чат для тестов, где можно посмотреть, какая сеть использовалась, кастомизировать поведение и даже обучать свои LoRA-модели.

Доступны:
— генерация изображений,
— смена внешности и одежды,
— создание видео с анимацией.

Фишка — сохранение идентичности: если сгенерируете видео с собой — это действительно будете вы.

До 14 июня — расширенный бесплатный период: до 50 изображений и 5 минут видео. Успей протестировать!

👉 Потыкать с сегодняшнего дня можно тут

#промо
Media is too big
VIEW IN TELEGRAM
Оdyssey

Публичная демка видеогенератора миров в реальном времени в браузере.

Я специально крутился, ходил и оборачивался чтобы убедиться что он помнит что находится за спиной. Это-то он помнит но посмотрите как ни с того ни с сего корежит дверь на 1:08

Чем дальше уходишь от начальной точки, тем с большей неохотой движок позволяет тебе идти. Как будто резина натянута.

И еще. Набор миров один и тот же. Я несколько раз заходил, перещелкивал и миры и попадал на одни и те же несколько раз. Есть большие сомнения что миры сочинены на ходу. Сделаем скидку на то что это демо, ждем чего-то понятного и практичного

#realtime #scene #world
This media is not supported in your browser
VIEW IN TELEGRAM
OmniConsistency: Learning Style-Agnostic Consistency from Paired Stylization Data

Плагин для улучшение качества стилизации изображений с помощью диффузионных моделей.

Для каждого стиля сначала независимо тренируются модули LoRA , а затем уже обученный модуль согласованности применяется к стилизованным изображениям

Код
Демо
Веса - в том числе пачка лор

#personalization #styletrasfer #stylization #lora #plugin
Topaz Bloom

Новsq апскейлер изображений от Topaz Labs.

Креативное увеличениt ИИ-изображений (а другие нельзя?) до 8 раз, с добавлением деталей и в то же время точное.

5 режимов креативности от Subtle до Max, 4 вариации за раз.

сегодня до полуночи (по их времени) всем бесплатный Bloom апскейл

Напишите "Bloom Day" в комментариях к официальному твиту для раннего доступа - будет действовать до полуночи. Не забудьте открыть личку для сообщений

#upscale
Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment

Новый апскейлер картинок от KAIST AI. Неплохо?

Принцип работы такой:

CoZ использует уже обученную модель для повышения разрешения, разбивая процесс на несколько этапов.

На каждом этапе модель применяет текстовые подсказки, сгенерированные специальной моделью, чтобы улучшить качество изображения при увеличении.

Это позволяет достигать экстремальных уровней увеличения (например, от 16x до 256x) с сохранением деталей и качества изображения.

Под капотом - #SD3, Qwen2.5-VL-3B-Instruct и какая-то модель RAM. Говорят, что 24 ГБ должно хватать, но рекомендуют 2 GPU

Код
Демо

Спасибо @asleephidden

#upscale
Sora бесплатно

Но только в мобильном приложении Bing

Устанавливаем Bing, в настройках Bing выставляем регион United States. Илем на экран со всеми сервисами и выбираем Video Creator. Если там нет интерфейса для создания видео, включаем впн.

Дают 10 бесплатных быстрых генераций, на обычные лимита нет. Не дают меня соотношения сторон и хронометраж, жёстко 9:16, 5 секунд

IOS / Android

#mobile #iOS #android #text2video
This media is not supported in your browser
VIEW IN TELEGRAM
PlayDiffusion

Редактирование речи - инпейнтинг звука речи на основе диффузии от Play HT / Play AI или как их там...

Сохраняет окружающий контекст, обеспечивая плавные переходы и согласованные характеристики говорящего.

Принимает на вход аудио до 50 секунд, файл до 50Мб


Попробовать на офсайте
Демо на HF
Веса
Код

Еще из новинок сервиса: липсинк


#audioinpainting #speech2speech #speechediting #tts #lipsync #text2speech
This media is not supported in your browser
VIEW IN TELEGRAM
У Suno опять обновки

Обновленный Song Editor: редактируйте все, что только можете себе представить. Меняйте порядок, переписывайте и переделывайте свой трек фрагмент за фрагментом — прямо из формы сигнала.

#musicediting
This media is not supported in your browser
VIEW IN TELEGRAM
OpenAudio S1

полностью кастомный ИИ-диктор от Fish Audio
Говорят что занял первое место на TTS-арене - не нашел

Клонирует голос за 15 секунд.
Можно выбирать любые эмоции, паузы, вздохи, шепот, крики, акценты и стили озвучки вашего текста.

Подходит для озвучки видео, аудиокниг, подкастов и так далее.

Поддерживает русский язык

#tts #text2speech #voicecloning
2025/07/02 02:11:34
Back to Top
HTML Embed Code: