Метаверсище и ИИще 13791

Метаверсище и ИИще

Сегодня день картиночных генераторов. Новых притом.

Помните писал про загадочный Riverflow на Image Arena.

Так вот, он вышел из тени и побивает всех на Image Editing Arena (в топе).

Давайте разбирацца.

Это малоизвестная компания Sourceful, которая уже полгода как на рынке со своими натренированными чекпойнтами специально для дизайна и упаковки. Подозреваю, что это дотренированная Stable Diffusion 3.5

И тут они бахают именно редактирующую модель.

Читаем:
Sourceful обучили модель языка визуального мышления (VLM) для включения диффузионных изображений (частично или полностью завершенных шагов) в Chain of Thought exploration пространства редактирования. Таким образом, мы получили возможность изменять направление пути редактирования, что обеспечивает более высокую согласованность, лучшее соблюдение многошаговых операций и более быстрые ответы на простые задачи редактирования. В Riverflow 1 мы не используем диффузионные модели Google или OpenAI, а вместо этого выбираем диффузионные модели с открытыми весами.

Какие модели с открытыми весами не пишут (я думаю что SD35).

Поглядите у них на сайте, как они избивают Нанабанану в различных тестах.
https://www.sourceful.com/research/introducing-sourceful-riverflow-1

Теперь о хорошем.
Есть бесплатные 70 кредитов (14 редактирований)
Скоро будет версия Pro
1K resolution
11 разных аспектов картинки
доступен также по API на https://runware.ai/ (немного странный выбор, ждем на fal.ai)
цены для АПИ:
riverflow-1-mini: $0.05 per image
riverflow-1: $0.066 per image

Теперь о плохом:
лепит огромные логотипы
генерация на сайте идет БОЛЬШЕ минуты (это дико долго)
пытается всучить вам макет для печати за деньги
сайт странный, с акцентом на старый генератор дизайнов и упаковок, я бы сделал отдельный сайт для редактирования, а то можно потеряться (идите в меню Create)
за 9 долларов в месяц дают всего 40 редактирований (200 кредитов)

Теперь тесты:
1. Белку перекрасила в зеленый, но в отличие от REVE, покрасила и рот тоже. Камеру удержала.
2. На бутылках цифры заменила, но камеру подвинула зачем-то.
3. На меня шляпу надела и футболку перекрасила в красный (текстуру потеряла), а когда снимала очки камеру опять дернула почему-то.

Давайте навалимся и потестируем, есть по 14 кретитов на редактирование у каждого (имейла).

https://www.sourceful.com/research/introducing-sourceful-riverflow-1

@cgevent

👍16❤12👎3

7.14K viewsSergey Tsyptsyn ️️, 10:52

Метаверсище и ИИще

Генератор картинок от Микрософта.

С марте писал про то, как OpenAI и Микрософт потихоньку ссорятся:
Микрософт в долгу не остается. Она работает над собственными моделями «рассуждений» (cемейство MAI), сопоставимыми с моделями o1 и o3-mini от OpenAI. Которые будет внедрять в свой Копилот, чтобы уйти от зависимости от OpenAI.

И вот сейчас они бахнули MAI-Image-1 (тонкий троллинг GPT-Image-1) - свою модель для генерации картинок.
Похваcтаться особо нечем, модель занимает 9е место на LMArena, зато можно написать вот так:
"Представляем MAI-Image-1, дебютировавшую в топ-10 на LMArena".

Судя по картинкам на сайте, немного предыдущее поколение генераторов. Уровень Flux.dev, кожа - пластик, но надо смотреть в деле.

А смотреть пока негде - обещают скоро выкатить в Copilot and Bing Image Creator.

Хотя.. вы можете поотлавливать модель на LMArena, она там официально появляется, если долго кликать.

https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/

@cgevent

👍9❤5👎2😁1

6.67K viewsSergey Tsyptsyn ️️, 11:17

Метаверсище и ИИще

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Veo 3.1 появился на wavespeed.ai и flowith.io

Разрешение 1080р, но длительность по прежнему 8 секунд.

Вечером ждем анонса от Гугла.

Промпт:
Context: A Panda named Bamboo and a Red Fox named Tweed host a casual, witty podcast called "Quantum Quibbles."
Task: Write the absolute shortest, most punchy opening exchange for an episode on quantum entanglement. Focus only on quick introductions and the topic title.
Panda (Bamboo): "Welcome to Quantum Quibbles! I'm Bamboo."
Red Fox (Tweed): "And I'm Tweed!"
Panda (Bamboo): "Today: Quantum Entanglement!"
Red Fox (Tweed): "Let's dive in."

@cgevent

1👍35👎7😁3❤1

7.35K viewsSergey Tsyptsyn ️️, 11:43

Нейропрожарка

Отличный веселый клип от грозы чата Сереги SVT. Отличная работа с Суно!

Описание: так как я любитель суно, созвучие нано банана сразу в голове спелось как багама мама, так и родилась идея сделать клип))
Надежда, что вот теперь всё редактирование будет одним промтом накрылось медным тазом и редактирования в нане оказалось такой, что большая часть было сделано по старинке в фотошопе , а уже финальные доводки в нанобанане и REVE. Я уже тут обсуждал недавно слабости наны и почему реве и квен выигрывают, не буду повторяться (ждем нану 2).
Консистентность делал без лорок, цель была узнать, что сейчас могут именно генераторы серии EDIT (Нано, РЕВЕ, квен)
Потому делал так:
1) Слова мои, англ перевод джемени
2) Песня в суно
3) Локации ЛА реальные, потому и убило кучу времени, в фотошопе всё сводить
4) Из платных приложений для картинок первый и последних кадров:
фотошоп - 50%
REVE - 45%
Нанобанана - 5%
5) Из бесплатных:
WAN 2,2 - 100%
6) видеогенерация
KLING - 2,1
KLING - 2,5
VEO - 3
7) Финал в Davinchi resolve

По затратам трудно сказать, у меня годовые подписки клинга, суно, фотошопа. А ВЕО3 всегда за 1 бакс в месяц ПРО подписка

Ролик в хорошем качестве тут:
https://www.youtube.com/watch?v=gk7K3YUciwM

@cgevent

🔥64👎35👍22❤4😁1

7.52K viewsSergey Tsyptsyn ️️, 12:30

Метаверсище и ИИще

У меня на Google Flow появился Veo 3.1

Штатовский ВПН.

@cgevent

🔥39👍6👎2❤1

8.36K viewsSergey Tsyptsyn ️️, 12:37

Метаверсище и ИИще

1:12

This media is not supported in your browser

VIEW IN TELEGRAM

Теперь официально: Veo3.1 в городе.

Копирую сюда инфо от Гугла (никаких минутных генераций не случилось, но есть video extensions):

- richer native audio
- better cinematic styles
- reference to video (ингредиенты)
- transitions between frames
- video extensions

Кстати, Хигсфилд раздает всем (платным) безлимитную (медленную) генерацию в Вео 3.1 до понедельника.
Подробности тут

@cgevent

👍13❤12😱1

8.61K viewsSergey Tsyptsyn ️️, 10:04

Метаверсище и ИИще

Sora 2 Pro Storyboard

Для олигархов и баяр с планом PRO вышел Сториборд для Соры.

25 секунд как с куста. Как тебе такое Veo3.1?

Смотрим подробности и пример борда ниже:
⬇️⬇️⬇️⬇️⬇️

@cgevent

❤13👍3👎1

8.23K viewsSergey Tsyptsyn ️️, 12:52

Метаверсище и ИИще

Forwarded from mimagie

0:15

Media is too big

VIEW IN TELEGRAM

Sora Storyboard:
- режет ровно как вы описали. это позволяет задавать ракурсы сильно точнее
- в рамках одной scene позволяет нагружать деталями. vfx, стиль.
- готовый ролик можно вернуть к редактированию (back to storyboard)
- по умолчанию 15 сек, но если нажать модель сора, выбрать 25 и переключиться в pro - сделает честно 25.

Промты для карточек ролика выше:
https://docs.google.com/document/d/1QKTBDK3tKghp-d0pKEZThp6DEWNpkNsEjPZJ0M5G_r0/edit?usp=sharing

🔥50👍10❤2👎1

8.47K viewsSergey Tsyptsyn ️️, 12:53

2025/10/23 17:38:31
Back to Top

HTML Embed Code:

<iframe width="100%" src="https://www.bootg.com/buyppe/web?embed=1" title="Telegram Web" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>