Сегодня день картиночных генераторов. Новых притом.
Помните писал про загадочный Riverflow на Image Arena.
Так вот, он вышел из тени и побивает всех на Image Editing Arena (в топе).
Давайте разбирацца.
Это малоизвестная компания Sourceful, которая уже полгода как на рынке со своими натренированными чекпойнтами специально для дизайна и упаковки. Подозреваю, что это дотренированная Stable Diffusion 3.5
И тут они бахают именно редактирующую модель.
Читаем:
Sourceful обучили модель языка визуального мышления (VLM) для включения диффузионных изображений (частично или полностью завершенных шагов) в Chain of Thought exploration пространства редактирования. Таким образом, мы получили возможность изменять направление пути редактирования, что обеспечивает более высокую согласованность, лучшее соблюдение многошаговых операций и более быстрые ответы на простые задачи редактирования. В Riverflow 1 мы не используем диффузионные модели Google или OpenAI, а вместо этого выбираем диффузионные модели с открытыми весами.
Какие модели с открытыми весами не пишут (я думаю что SD35).
Поглядите у них на сайте, как они избивают Нанабанану в различных тестах.
https://www.sourceful.com/research/introducing-sourceful-riverflow-1
Теперь о хорошем.
Есть бесплатные 70 кредитов (14 редактирований)
Скоро будет версия Pro
1K resolution
11 разных аспектов картинки
доступен также по API на https://runware.ai/ (немного странный выбор, ждем на fal.ai)
цены для АПИ:
riverflow-1-mini: $0.05 per image
riverflow-1: $0.066 per image
Теперь о плохом:
лепит огромные логотипы
генерация на сайте идет БОЛЬШЕ минуты (это дико долго)
пытается всучить вам макет для печати за деньги
сайт странный, с акцентом на старый генератор дизайнов и упаковок, я бы сделал отдельный сайт для редактирования, а то можно потеряться (идите в меню Create)
за 9 долларов в месяц дают всего 40 редактирований (200 кредитов)
Теперь тесты:
1. Белку перекрасила в зеленый, но в отличие от REVE, покрасила и рот тоже. Камеру удержала.
2. На бутылках цифры заменила, но камеру подвинула зачем-то.
3. На меня шляпу надела и футболку перекрасила в красный (текстуру потеряла), а когда снимала очки камеру опять дернула почему-то.
Давайте навалимся и потестируем, есть по 14 кретитов на редактирование у каждого (имейла).
https://www.sourceful.com/research/introducing-sourceful-riverflow-1
@cgevent
Помните писал про загадочный Riverflow на Image Arena.
Так вот, он вышел из тени и побивает всех на Image Editing Arena (в топе).
Давайте разбирацца.
Это малоизвестная компания Sourceful, которая уже полгода как на рынке со своими натренированными чекпойнтами специально для дизайна и упаковки. Подозреваю, что это дотренированная Stable Diffusion 3.5
И тут они бахают именно редактирующую модель.
Читаем:
Sourceful обучили модель языка визуального мышления (VLM) для включения диффузионных изображений (частично или полностью завершенных шагов) в Chain of Thought exploration пространства редактирования. Таким образом, мы получили возможность изменять направление пути редактирования, что обеспечивает более высокую согласованность, лучшее соблюдение многошаговых операций и более быстрые ответы на простые задачи редактирования. В Riverflow 1 мы не используем диффузионные модели Google или OpenAI, а вместо этого выбираем диффузионные модели с открытыми весами.
Какие модели с открытыми весами не пишут (я думаю что SD35).
Поглядите у них на сайте, как они избивают Нанабанану в различных тестах.
https://www.sourceful.com/research/introducing-sourceful-riverflow-1
Теперь о хорошем.
Есть бесплатные 70 кредитов (14 редактирований)
Скоро будет версия Pro
1K resolution
11 разных аспектов картинки
доступен также по API на https://runware.ai/ (немного странный выбор, ждем на fal.ai)
цены для АПИ:
riverflow-1-mini: $0.05 per image
riverflow-1: $0.066 per image
Теперь о плохом:
лепит огромные логотипы
генерация на сайте идет БОЛЬШЕ минуты (это дико долго)
пытается всучить вам макет для печати за деньги
сайт странный, с акцентом на старый генератор дизайнов и упаковок, я бы сделал отдельный сайт для редактирования, а то можно потеряться (идите в меню Create)
за 9 долларов в месяц дают всего 40 редактирований (200 кредитов)
Теперь тесты:
1. Белку перекрасила в зеленый, но в отличие от REVE, покрасила и рот тоже. Камеру удержала.
2. На бутылках цифры заменила, но камеру подвинула зачем-то.
3. На меня шляпу надела и футболку перекрасила в красный (текстуру потеряла), а когда снимала очки камеру опять дернула почему-то.
Давайте навалимся и потестируем, есть по 14 кретитов на редактирование у каждого (имейла).
https://www.sourceful.com/research/introducing-sourceful-riverflow-1
@cgevent
👍16❤12👎3
Генератор картинок от Микрософта.
С марте писал про то, как OpenAI и Микрософт потихоньку ссорятся:
Микрософт в долгу не остается. Она работает над собственными моделями «рассуждений» (cемейство MAI), сопоставимыми с моделями o1 и o3-mini от OpenAI. Которые будет внедрять в свой Копилот, чтобы уйти от зависимости от OpenAI.
И вот сейчас они бахнули MAI-Image-1 (тонкий троллинг GPT-Image-1) - свою модель для генерации картинок.
Похваcтаться особо нечем, модель занимает 9е место на LMArena, зато можно написать вот так:
"Представляем MAI-Image-1, дебютировавшую в топ-10 на LMArena".
Судя по картинкам на сайте, немного предыдущее поколение генераторов. Уровень Flux.dev, кожа - пластик, но надо смотреть в деле.
А смотреть пока негде - обещают скоро выкатить в Copilot and Bing Image Creator.
Хотя.. вы можете поотлавливать модель на LMArena, она там официально появляется, если долго кликать.
https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/
@cgevent
С марте писал про то, как OpenAI и Микрософт потихоньку ссорятся:
Микрософт в долгу не остается. Она работает над собственными моделями «рассуждений» (cемейство MAI), сопоставимыми с моделями o1 и o3-mini от OpenAI. Которые будет внедрять в свой Копилот, чтобы уйти от зависимости от OpenAI.
И вот сейчас они бахнули MAI-Image-1 (тонкий троллинг GPT-Image-1) - свою модель для генерации картинок.
Похваcтаться особо нечем, модель занимает 9е место на LMArena, зато можно написать вот так:
"Представляем MAI-Image-1, дебютировавшую в топ-10 на LMArena".
Судя по картинкам на сайте, немного предыдущее поколение генераторов. Уровень Flux.dev, кожа - пластик, но надо смотреть в деле.
А смотреть пока негде - обещают скоро выкатить в Copilot and Bing Image Creator.
Хотя.. вы можете поотлавливать модель на LMArena, она там официально появляется, если долго кликать.
https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/
@cgevent
👍9❤5👎2😁1
Veo 3.1 появился на wavespeed.ai и flowith.io
Разрешение 1080р, но длительность по прежнему 8 секунд.
Вечером ждем анонса от Гугла.
Промпт:
Context: A Panda named Bamboo and a Red Fox named Tweed host a casual, witty podcast called "Quantum Quibbles."
Task: Write the absolute shortest, most punchy opening exchange for an episode on quantum entanglement. Focus only on quick introductions and the topic title.
Panda (Bamboo): "Welcome to Quantum Quibbles! I'm Bamboo."
Red Fox (Tweed): "And I'm Tweed!"
Panda (Bamboo): "Today: Quantum Entanglement!"
Red Fox (Tweed): "Let's dive in."
@cgevent
Разрешение 1080р, но длительность по прежнему 8 секунд.
Вечером ждем анонса от Гугла.
Промпт:
Context: A Panda named Bamboo and a Red Fox named Tweed host a casual, witty podcast called "Quantum Quibbles."
Task: Write the absolute shortest, most punchy opening exchange for an episode on quantum entanglement. Focus only on quick introductions and the topic title.
Panda (Bamboo): "Welcome to Quantum Quibbles! I'm Bamboo."
Red Fox (Tweed): "And I'm Tweed!"
Panda (Bamboo): "Today: Quantum Entanglement!"
Red Fox (Tweed): "Let's dive in."
@cgevent
1👍35👎7😁3❤1
Media is too big
VIEW IN TELEGRAM
Нейропрожарка
Отличный веселый клип от грозы чата Сереги SVT. Отличная работа с Суно!
Описание: так как я любитель суно, созвучие нано банана сразу в голове спелось как багама мама, так и родилась идея сделать клип))
Надежда, что вот теперь всё редактирование будет одним промтом накрылось медным тазом и редактирования в нане оказалось такой, что большая часть было сделано по старинке в фотошопе , а уже финальные доводки в нанобанане и REVE. Я уже тут обсуждал недавно слабости наны и почему реве и квен выигрывают, не буду повторяться (ждем нану 2).
Консистентность делал без лорок, цель была узнать, что сейчас могут именно генераторы серии EDIT (Нано, РЕВЕ, квен)
Потому делал так:
1) Слова мои, англ перевод джемени
2) Песня в суно
3) Локации ЛА реальные, потому и убило кучу времени, в фотошопе всё сводить
4) Из платных приложений для картинок первый и последних кадров:
фотошоп - 50%
REVE - 45%
Нанобанана - 5%
5) Из бесплатных:
WAN 2,2 - 100%
6) видеогенерация
KLING - 2,1
KLING - 2,5
VEO - 3
7) Финал в Davinchi resolve
По затратам трудно сказать, у меня годовые подписки клинга, суно, фотошопа. А ВЕО3 всегда за 1 бакс в месяц ПРО подписка
Ролик в хорошем качестве тут:
https://www.youtube.com/watch?v=gk7K3YUciwM
@cgevent
Отличный веселый клип от грозы чата Сереги SVT. Отличная работа с Суно!
Описание: так как я любитель суно, созвучие нано банана сразу в голове спелось как багама мама, так и родилась идея сделать клип))
Надежда, что вот теперь всё редактирование будет одним промтом накрылось медным тазом и редактирования в нане оказалось такой, что большая часть было сделано по старинке в фотошопе , а уже финальные доводки в нанобанане и REVE. Я уже тут обсуждал недавно слабости наны и почему реве и квен выигрывают, не буду повторяться (ждем нану 2).
Консистентность делал без лорок, цель была узнать, что сейчас могут именно генераторы серии EDIT (Нано, РЕВЕ, квен)
Потому делал так:
1) Слова мои, англ перевод джемени
2) Песня в суно
3) Локации ЛА реальные, потому и убило кучу времени, в фотошопе всё сводить
4) Из платных приложений для картинок первый и последних кадров:
фотошоп - 50%
REVE - 45%
Нанобанана - 5%
5) Из бесплатных:
WAN 2,2 - 100%
6) видеогенерация
KLING - 2,1
KLING - 2,5
VEO - 3
7) Финал в Davinchi resolve
По затратам трудно сказать, у меня годовые подписки клинга, суно, фотошопа. А ВЕО3 всегда за 1 бакс в месяц ПРО подписка
Ролик в хорошем качестве тут:
https://www.youtube.com/watch?v=gk7K3YUciwM
@cgevent
🔥64👎35👍22❤4😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Теперь официально: Veo3.1 в городе.
Копирую сюда инфо от Гугла (никаких минутных генераций не случилось, но есть video extensions):
- richer native audio
- better cinematic styles
- reference to video (ингредиенты)
- transitions between frames
- video extensions
Кстати, Хигсфилд раздает всем (платным) безлимитную (медленную) генерацию в Вео 3.1 до понедельника.
Подробности тут
@cgevent
Копирую сюда инфо от Гугла (никаких минутных генераций не случилось, но есть video extensions):
- richer native audio
- better cinematic styles
- reference to video (ингредиенты)
- transitions between frames
- video extensions
Кстати, Хигсфилд раздает всем (платным) безлимитную (медленную) генерацию в Вео 3.1 до понедельника.
Подробности тут
@cgevent
👍13❤12😱1
Sora 2 Pro Storyboard
Для олигархов и баяр с планом PRO вышел Сториборд для Соры.
25 секунд как с куста. Как тебе такое Veo3.1?
Смотрим подробности и пример борда ниже:
⬇️⬇️⬇️⬇️⬇️
@cgevent
Для олигархов и баяр с планом PRO вышел Сториборд для Соры.
25 секунд как с куста. Как тебе такое Veo3.1?
Смотрим подробности и пример борда ниже:
⬇️⬇️⬇️⬇️⬇️
@cgevent
❤13👍3👎1
Forwarded from mimagie
Media is too big
VIEW IN TELEGRAM
Sora Storyboard:
- режет ровно как вы описали. это позволяет задавать ракурсы сильно точнее
- в рамках одной scene позволяет нагружать деталями. vfx, стиль.
- готовый ролик можно вернуть к редактированию (back to storyboard)
- по умолчанию 15 сек, но если нажать модель сора, выбрать 25 и переключиться в pro - сделает честно 25.
Промты для карточек ролика выше:
https://docs.google.com/document/d/1QKTBDK3tKghp-d0pKEZThp6DEWNpkNsEjPZJ0M5G_r0/edit?usp=sharing
- режет ровно как вы описали. это позволяет задавать ракурсы сильно точнее
- в рамках одной scene позволяет нагружать деталями. vfx, стиль.
- готовый ролик можно вернуть к редактированию (back to storyboard)
- по умолчанию 15 сек, но если нажать модель сора, выбрать 25 и переключиться в pro - сделает честно 25.
Промты для карточек ролика выше:
https://docs.google.com/document/d/1QKTBDK3tKghp-d0pKEZThp6DEWNpkNsEjPZJ0M5G_r0/edit?usp=sharing
🔥50👍10❤2👎1