Telegram Web Link
Я постил новость о том, что Илья Суцкевер ушел из OpenAI. Весь интернет, конечно, гадает куда.
Сегодня увидел вот такую версию.
"Амбициозный проект", "крупный банк". Не иначе как Сбер??
https://www.tg-me.com/ai_ins/3299
А тем временем битва за данные продолжается.

Я уже писал, что открытие gpt-4o для всех, это, прежде всего, охота за новыми данными, данными для обучения. Которые юзеры будут вливать в жерло ИИ своими неистовыми промптами, картинками, видосами и диалогами.

Тут уже прошла новость о том, что OpenAI запартнерился с со StackOverflow, для которых это прям хорошая сделка, ибо с появлением ИИ, пишущего код, трафик на их сайте просел на 47%. Правда, подобно художниками, некоторые кожаные программеры взорали: "а чо это этот тупой ИИ учится на нашем коде, мы на такое не подписывались". И ну портить код в своих аккаунтах. В общем, все как у людей.

А сейчас вот OpenAI удачно подписали соглашение в Реддитом. Ведь с реддита все и начиналось, их ранние модели GPT-x обучались на данных с Реддита (неофициально как бы). И Реддит - это прям Клондайк для данных - отборное кожаное общение без прикрас и цензуры.

Данные новая нефть, банально уже до коликов, но факт. И источник хороших доходов. Кто бы мог подумать, что все эти глупости, которые мы изрыгаем в сеть, все эти нарциссические картинки и неумные комментарии будут так цениться на рынке в 2024 году.
https://openai.com/index/openai-and-reddit-partnership/

Аптдейт. Маск тем временем, пришел в 4Chan и подписался с ними на использование всего этого ада для Grok.
This media is not supported in your browser
VIEW IN TELEGRAM
Хуньянь: новый генератор картинко от ТикТока, с весами и кодом.
Прежде чем восторженно перепащивать, читаем следующий пост.
Хуньянь: Китайский генератор картинок от ТикТока. С весами и пирогами.

Коль скоро SD3 мы увидим примерно никто не знает когда, то смотрим, вокруг.
ТикТок выкатил свою модель. С кодом и весами.
Ну и конечно по их китайским тестам она бьет весь опенсорс (включая SD3), скромно уступая Midjourney и DALL·E 3.

Но мы ж не просто перепащиваем новости и визжим от черрипикнутых картинок с их сайта.

Лезем в демо и тестируем. Расчехляем промпт с принцессой.
Они делают акцент на улучшенное понимание китайского языка. Тут мне похвастаться нечем, я погонял на английском.

И да, там есть Prompt Enhancement, как в фооокусе, добавление текстовой красоты в промпт. Работает забавно. Но мыло не убирает.
Три сэмплера, третий не работает.

На итоге: уровень SD2 или SD1.5. Сильное мыло, беда с руками, постоянно сваливается в аниме. Возможно если бы были крутилки, можно что-то докрутить, но в демо нет никаких крутилок.
Можно поставить локально, может быть там будет больше параметров.

Он совершенно не умеет в людей, но на всяких узорах и декорах ведет себя пристойно, даже мылит меньше. Похоже на первый firefly.

Для тех, кто в NSFW - очень забавная цензура. Промпт не отвергает, но пытается укутать картинку хотя бы в белье. Постоянно сваливается в аниме, от греха подальше. Когда добиваешь негативным промтом, изорачиваетя. Мылит соски, прячет детали. Похоже на поведение SDXL.

Все явки и пароли тут:
https://github.com/Tencent/HunyuanDiT

Потестируйте, может у вас китайский хороший...
Если вернуться к аналогиям с рассерженными художниками и программерами, то я все ждал, когда начнется волна гонений на Suno и Udio. Это ж какая угроза музыкальной индустрии и повод выпить за музыкантов. Музыка пришла на полянку GenAI последней (по масс адопшену, скажем так), и пришла сразу не с пустыми руками, а в виде охренительных генераторов. Музыканты уже приподвзвыли, Там Билли Айлиш с пацанами уже протестуют в интернетике.
Но с горы уже спускаются очень взрослые мальчики с юристами наперевес. Которые вопрошают: а вы где музычку скачали для тренировки.
И пока OpenAI лихорадочно заключает соглашения с медиа-ресурсами, StackOverflow и Реддитом, чтобы иметь справку из школы, а Маск закупает данные с 4Chan, музыкальным стартапам придется несладко. Столько денег у них нет, чтобы договариваться с Ворнером или Сони.
Кто будет следующим Stable Music Diffusion? Чтобы можно было тренировать, тюнить, выпускать свои модели в опенсорс:
Читаем ниже:
Forwarded from Denis Sexy IT 🤖
😐 Корпорация Sony Music напряглась от такого количества генераторов музыки и приступила к запугиванию: они написали письма ~700 стартапам, с просьбой рассказать, как музыка лицензируемая Sony используется в тренировках

Это чистая атака на музыкальные GenAI стартапы, потому что закона обвязывающего показывать, что в датасете – нет

Потом будут использовать эти ответы в суде и может быть как-то прессовать тех, кто не ответят

Но я не удивлен если честно, музыкальные модели только в опенсорсе мне кажется будут развиваться, аналогично Stable Diffusion – чтобы выстоять перед давлением Sony Music нужно иметь серьезных юристов за плечами

Ссылка на новость
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from AI Product | Igor Akimov
OpenAI анонсировали улучшение в анализе данных.

1. Загрузка файлов напрямую из Google Drive и Microsoft OneDrive:
- Больше не нужно загружать файлы на рабочий стол и затем загружать их в ChatGPT. Теперь можно добавлять файлы напрямую из облачных хранилищ, что ускоряет процесс анализа данных.

2. Работа с таблицами в реальном времени:
- ChatGPT создаст интерактивную таблицу, которую можно развернуть на весь экран. Вы сможете следить за обновлениями таблицы в процессе анализа, задавать уточняющие вопросы или выбирать подсказки для более глубокого анализа.

3. Настройка и скачивание диаграмм для презентаций и документов:
- Вы можете настраивать и взаимодействовать с различными типами диаграмм (столбчатые, линейные, круговые и точечные диаграммы) прямо в разговоре. Когда диаграмма будет готова, её можно скачать для использования в презентациях или документах.

Выглядит интересно. И снова подкосит сотню стартапов :)
https://openai.com/index/improvements-to-data-analysis-in-chatgpt/
ИИ-поздравлялки.

Вчера был какой-то угарный день, в канал влетело 300 человек - в основном из-за репостов истории про то, как Gemini матерится на OpenAI. Хороший контент рулит.

И я совершенно пропустил момент, когда мы пробили 25 000!
Глянул вечером, оппаньки! Раздулся от гордости и ну продолжать писать глупости.

В общем, напишите мне в коментах что-то приятное, а я буду дальше раздуваться и писать.
Если вы совсем дерзкие, можете жбакнуть по кнопке "Поддержать" в закрепе и метнуть TON в мою сторону, но это совершенно не обязательно.

Чтобы пост был не совсем бесполезным для вас, вот вам промп для gpt-4o, который позволяет сделать картинку в точности по тексту, без раскучерявливания.

make picture with exact prompt "25k subscribers" with no prompt enhancement and show me this prompt in json-format after

Он выдаст вам вот так, чтобы вы могли его контролировать:
{
"prompt": "25k subscribers",
"size": "1024x1024"
}

Есть еще параметр n:1, но он не работает. А когда-то был даже seed но его убрали. Про разрешения спросите его, он расскажет.

Мне вот такая картинка без стереотипов и приукрашиваний вполне себе нравится. С приукрашиваниями получаются банальные логосы с кривым текстом.

Это я к чему. Покидайте в него промпты типа "." или " " или "`" или ":)" или куски кода.
Обнаружилось, что его ломает "{" или "}" в любых включениях и он не может в пустой промпт "". В отличие от Stable Diffusion. Системный промпт ломается очевидно.

Получите странные картинки. Меня сразило, когда он на чистый пробел " " выдал мне Будду. Совпадение?

И не увлекайтесь, сначала поздравлялки, потом картинки.

Ваш ИИ-дедован.
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшой трик, который вы можете использовать, чтобы повысить удобство использования генераций во время рисования:

Скачиваете Windows on Top, накладываете окно Photoshop поверх Krea.ai, включаете стриминг окна Photoshop и рисуете поверх генерации.
2024/05/20 09:30:40
Back to Top
HTML Embed Code: