Telegram Web Link
Новый генератор — шлак?

Генерацию картинок в 4o уже раскатили. Похоже, что вопреки всему, этот генератор ничем не хуже текущего топа. Рандомные примеры от комьюнити и мои тесты прилагаются.


Окей, генерит он и фотореализм тоже, но вот с лицами что-то не так. В первом моём тесте я вообще на себя не похож. Сравните с Gemini. Может, просто не повезло?

Бегом тестить пока сервер не лег!

@ai_newz
92👍40😁10🔥3🤯3🙏1🦄1
This media is not supported in your browser
VIEW IN TELEGRAM
Ideogram 3.0

Рисует красиво, ничего не скажешь. Заявляют SOTA на внутренних метриках, других бенчмарков нет. Из функционала, с релизом модели докинули возможность создавать свои стили (да, этого там не было). А с последнего раза когда я писал про них, завезли ещё и inpaint/outpaint.

Бесплатно дают 10 "медленных" кредитов в неделю, этого достаточно на 6-20 генераций с новой моделью, в зависимости от режима. Платная подписка начинается с 8 долларов в месяц и доходит до 60.

Блогпост
ideogram.ai

@ai_newz
582👍40🔥15😁4
GPT-4o серьёзно апнули

Модель заметно выросла по всем бенчам, особенно по кодингу. Модель сравнялась в бенчах с новой Claude 3.7 и апдейтнутой DeepSeek V3. До ризонеров довольно далеко, но ризонеры дорогие и подходят не для всех задач. К сожалению, сравнения с GPT-4.5 нет (сильно дорого бенчмаркать), но судя по LMSYS арене, новая GPT-4o лучше чем GPT-4.5.

@ai_newz
109👍220🔥54😁301410😱5🙏2🦄2
Сколько энергии тратят LLM на юзера?

Нашёл в интернете классную инфографику, наглядно показывающую сколько энергии нужно на год использования LLM, в сравнении с другими ежедневными занятиями. Исходят из расчёта на 100 обычных сообщений в день с не reasoning моделью. К методике у меня есть пара претензий, да и всё очень сильно зависит от конкретной модели, но порядок цифр верный. Я всё ещё постоянно вижу заявления о каких-то безумных расходах энергии и воды, даже от уважаемых изданий, надеюсь такой дезинформации станет меньше.

@ai_newz
8👍27650🤯15🔥14😁11🦄5🫡1
Нейродайджест за неделю (#62)

LLM
- Нативная мультимодальная генерация картинок в 4o — Сама наконец развязал руки 4o. Прекрасно генерит картинки и редактирует их текстом, к тому же без дотошной цензуры. Но при этом крутит детали и меняет лица при редактировании. Правда, пока сервера положили все те, кто делают что-то там в стиле Ghibli. Более того, GPT-4o серьёзно апнули — Малая по бенчам сравнялась с Claude 3.7.
- DeepSeek V3 обновили — Дотюнили изначальный вариант, по бенчам немного подскачил.
- Gemini 2.5 Pro — Пушка от Google и СОТА модель сегодняшний день (выкуси Сама).
- Чатботы почти не тратят электроэнергию — Сравнение расходов электричества на LLM и другие повседневные дела.

Роботех
- LeRobot — Опенсорс-робототехника жёстко обновилась: роборуку можно собрать за 110 баксов, а потом за ночь обучить на домашнем железе.

Генеративные картиночные модели
- REVE — Новая СОТА в text2image. Отличное понимание промпта и знание русской эстетики.
- Ideogram 3.0 — Говорят, что СОТА, но на деле неизвестно. Выложили в ответ REVE и OpenAI.

> Читать дайджест #61

#дайджест
@ai_newz
1🔥56👍3522❤‍🔥6💯3😁1
А вот и YandexGPT 5 Lite Instruct подъехал в опенсорс.

Я уже писал про 5-е поколение моделей Яндекса, но тогда выложили только pre-train версию, а теперь релизят Instruct версию. Ее неплохо бафнули в плане кода и матана и увеличили контекст с 8 до 32k. По сравнению с Qwen 2.5-7B-Instruct моделька значительно лучше справляется с классификацией и разметкой русского языка, в том числе в вопросах культурного наследия и локальных фактов. Челы из Яндекса хвастают, что в side-by-side обходят Qwen в 62% и имеют паритет с YandexGPT 4 Pro, а в типичных задачах сервисов Яндекса обходят даже GPT-4o Mini.

Добавили также поддержку llama.cpp и GGUF. Моделька всего на 8B, так что влезет в домашний ПК.

Кроме того, обновили лицензию. Теперь обе модельки можно использовать в коммерческих целях — но не более 10 млн выходных токенов в месяц.Хватит на небольшого кастомер-саппорт-бота. Однако крупному бизнесу придётся платить за лицензию. Для них приятная плюшка — это совместимость с OpenAI API в Yandex Cloud. То есть можно переключаться между ними практически бесшовно. Странно, что сразу так не сделали.

Обнимающее лицо

@ai_newz
😁112👍72❤‍🔥36🦄96🤯3🔥1😱1🤩1🫡1
GPT 4o залетела на Image Arena

Модель теперь делит первое место с Reve, а Ideogram V3 на арену пока что так и не добралась. Это не единственная LLM на арене — там уже есть Gemini 2.0 Flash, которая по качеству где-то между Stable Diffusion 3.5 Medium и FLUX 1.0 schnell, что на целых 150 ELO отстаёт от топа. Кстати, возможности генерации изображений должны быть у всех моделей Gemini, интересно что будет выдавать Gemini 2.5 Pro, когда её включат, и как повиляет на это ризонинг.

А как скоро LLM начнут генерить ещё и видео? Хотя такая статейка уже была у гугла пару лет назад.

@ai_newz
69👍36🔥11🤯5🦄1
Media is too big
VIEW IN TELEGRAM
GEN-4, Runway is soo back 🔥🔥🔥

После выхода GEN-3 прошло довольно много времени, и после релиза Kling 1.6 использовать Runway было как-то зашкварно. Хотя у них и был безлимитный план. А после выхода Luma Ray 2, где теперь тоже есть безлим, Runway был вообще бесполезным и в последнее время казался морально устаревшим.

А теперь они без предварительных анонсов неожиданно дропают модельку на уровне VEO 2 🔥

Сразу с img2video, более того — это одна из самых лучших моделей в плане подхвата референса по одной картинке с очень хорошей консистентностью. В демо-черрипиках — это уровень Grok 3 и Gemini Flash 2.0 (даже не 4o).

Никаких технических данных нет, как обычно. Но выглядит так, будто она вообще не трогает детали референса, только рисует новые ракурсы и моушен. Пока звучит как фантастика, нужно щупать своими ручками.

Но ждать недолго! Её уже должны были открыть для платных пользователей.

Черрипики-фильмы от ранвей в ниже.

Анонс

@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
73👍34🤩15🔥9😍3😁1
2025/07/09 21:56:58
Back to Top
HTML Embed Code: