Telegram Web Link
Forwarded from Content Review
Дипфейки и симулякры

Утренняя реплика Илья Власова о бургерах, которые никто не готовил, и моделях, которые не существуют

Бодрийяр в своё время придумал концепцию симулякра, копии без оригинала. Тут не философский канал и мы не философы, но его изложение этой концепции относительно конструирующих реальность медиа кажется ещё более актуальным в эпоху искусственного интеллекта. Генеративный ИИ выступает как конвейер на пути между второй (где за образом ещё стоит вещь) и третьей (где эта вещь исчезает) стадиями бодрийяровской эволюции.

Возьмём, к примеру, Uber Eats. Недавно сервис ввёл новую генеративную функцию для улучшения фотографий блюд в меню. Она может переложить бургер на красивую тарелку, поменять фон, освещение, дорисовать недостающие ингредиенты или даже увеличить порцию (чуть заметно, само собой, чтобы не нарушать закон). Едва ли нас можно удивить тем, что товар на картинке в интернете отличается от своего реального прототипа – но тут скорее важно, что сейчас этот процесс автоматизирован и поставлен на поток, а обрабатываются (за вознаграждение) даже загруженные юзерами фотографии. Зачем это нужно, догадаться не сложно – такие фото повышают конверсию покупок на 15-30%.

В другой ситуации арендодатель с Airbnb попытался стрясти денег с арендатора за порчу имущества, прикрепив… Сгенерированную картинку. Просто мошенничество, скажете вы – но тут дело в том, что раньше подобное было скорее редкостью, ведь нужно учить Фотошоп или нанимать специально обученного человека. А тут загрузил в ChatGPT, попросил добавить трещину на предмет – и готово. Платформа поверила арендодателю на слово, даже не почесавшись для перепроверки и явно недооценивая подобные риски.

Третья ситуация оказалась у всех на слуху – речь про Vogue и их рекламу Guess с нейромоделью. Здесь уже ситуация интереснее, потому что фешн начинает, уходя ещё дальше от реальности, превращаться в условный конструктор сайтов, где надо добавить несколько блоков (наряд, типаж, цвет глаз, длина волос, фон…) – и получить нужный результат.

Картинка еды в приложении – это генеративная симуляция блюда, которое никто не готовил. Виртуальная модель в глянце – симуляция образа человека, сконструированная из набора заданных токенов. Мы уже приближаемся к миру, который Жан Бодрийяр называл «царством симулякров», маскирующих отсутствие настоящей реальности и в итоге вымещающих её. Возникает почти гиперреальная ситуация: мы чаще взаимодействуем не с вещами, а с их цифровыми образами; не с едой, а с представлением о еде; не с людьми, а с виртуальными образами.

Рестораны всё ещё готовят бургеры, и Nike по-прежнему шьёт кроссовки – но маржа смещается к цифровому слою, а воспринимаемая ценность отрывается от материала. Инструменты редактирования «реальности» становятся доступны по клику и станут ещё доступнее с появлением AR-очков и имплантов, а проверка на достоверность остаётся дорогой и сложной. В конце концов все образы, которые можно заменить красивой моделью (визуальной, речевой, поведенческой) – вероятно, будут заменены. Потому что это дешевле, масштабируемо и, что важно, достаточно похоже.

#утренняяреплика
🔥6
Сбер объявил о выделении 1 миллиарда рублей на поддержку новых образовательных программ в сфере ИИ и ИТ. Выглядит красиво – деньги пойдут 6 ВУЗам на 14 программ, по итогу должно появиться 2200 новых специалистов. Кого-то может смутить итоговый расклад в 450 тысяч за 1 нового специалиста, но это не такие уж большие деньги.

Смешно другое. Деньги, как это водится, из семьи не уйдут. Какую-то – подозреваем, что большую – часть направят на обучение преподавателей на площадке Сбера. Очевидно, что обучать их будут не Perplexity с Gemini, а Гигачату с Кандинским. Как говорится, ИИ есть у нас дома.

При этом стоит помнить о том, что современные ИИ-технологии – это не про искусственный интеллект, а про более продвинутую автоматизацию и алгоритмы. К сожалению, текущее развитие ИИ-технологий позволяет лишь копировать и компилировать то, что было создано человеком. Ну, или другим генеративным сервисом.
😁4🤯3
Аишка
что будет делать Маск, когда на его платформе начнут генерировать голые дипфейки реальных людей?
Что и требовалось доказать – The Verge пишут, что Imagine от Grok раздел Тейлор Свифт. Это было быстро, сервис ещё даже толком релизнуть не успели.

Илон Маск зачем-то переизобретает CivitAI…
3🍾3😁1
Xiaomi представила свою голосовую нейросеть MiDashengLM-7B. Модель обучена на миллионе часов аудио и уже обходит OpenAI Whisper (лидер рынка) в ряде задач. Главное, что она помимо речи различает звуки, музыку и реагирует (по заявлениям разработчиков) быстрее аналогов.

Звучит как задел на будущее, где с машиной можно будет разговаривать как с человеком. Управление сиденьями, маршрутами, даже взаимодействие с другими автомобилями – всё это станет частью голосового интерфейса нового поколения.

Подробнее расписали в Электричке.
Удобно
😁10
«Grok 5 выйдет до конца этого года и будет невероятно хорош» – Маск

P.S. Представили лицо инженеров xAI, которые из твита узнали, что работать придётся в 2 раза больше и начинается очередной аврал
1😁9
Было/стало. Как-то даже грустно, больше не целый зоопарк. И люди перестанут спрашивать, какой моделью пользоваться
2💘53
Итак, случилось – OpenAI представила GPT-5. Теперь это новая основная модель ChatGPT.

Если коротко, то почти все утечки, о которых мы писали раньше – подтвердились. Модель стала:
• гибридной (сама решает, когда и как долго «думать»)
• мультимодальной (понимает картинки, как GPT-4o). Правда, аудио и голосовой режим пока работают на том же GPT-4o.
• с новыми агентными инструментами
• с более длинным контекстом (400 тысяч токенов суммарно)
• с меньшим количеством галлюцинаций
• бесплатной (с ограничениями).

Теперь чуть подробнее. Формально это «унифицированная система», но по сути речь о гибридной архитектуре, которую первой в массовом формате показали Anthropic в Claude. Если раньше приходилось выбирать между условным o3, который лучше справлялся с поиском и сложными задачами, и 4o, который быстрее и лучше писал тексты, то теперь ChatGPT сам выбирает режим: быстрый и дешёвый или медленный, с «долгим размышлением».

Мы, кстати, давно писали, что индустрия движется к гибридному подходу и почему это хорошая тенденция, а «режим рассуждений» априори благом не является.

Параллельно OpenAI решают проблему, которую сами же создали – вместе с зоопарком моделей, непонятных большей части пользователей с личной жизнью. Про их нейминг давно ходят мемы – 4o, o3, o4, 4.1, 4.5 и ещё куча версий зачем-то существовали одновременно в рамках единого интерфейса. Теперь всё спрятано под капот.

Из дополнительных обновлений – появились предустановленные «личности», от циничной до поддерживающей (привет, Grok… 18+ режима нет), улучшенный голосовой режим, интеграция с Gmail и Google Calendar для Pro-пользователей. Правда, насчёт интеграции не понятно – а в чём новость? Потому что она была доступна и раньше, через экран «коннекторов» в настройках, да и у конкурентов вроде Claude давно есть.

Что с ценой? Утечки, что модель будет бесплатной для всех пользователей, подтвердились – можно использовать даже без подписки. Но с лимитами – 10 сообщений за 5 часов, дальше переключение на версию mini. Цена API в целом стала ниже.
1👍41
Судя по всему, вот что бывает, когда слайды делает ИИ «уровня доктора наук» (если кто-то ещё не пропускает мимо ушей эти маркетинговые формулировки). Ну что же, подождём, пока он станет «заслуженным академиком»

P.S. Обещаем, что это последний пост про GPT-5 на сегодня
😁5
#нейродайджест Аишки за неделю

Эпоха дипфейков и симулякров: от ИИ-бургеров в Uber Eats до виртуальных моделей в Vogue

GPT-5 здесь. Новая гибридная модель сама решает, когда «думать» долго, а когда отвечать быстро

Битва за розетку – бигтех и энергокомпании не определились, кто должен платить

Война с ботами: Cloudflare обвинил Perplexity в обходе robots.txt через маскировку

Genie 3 создает игровые миры – обновление модели для генерации миров в реальном времени

Grok Imagine пока не ОК и генерирует устаревшие по качеству видео ещё до релиза… Зато без цензуры

ChatGPT учится быть психологом: OpenAI добавил напоминания сделать паузу во время общения

Сбер потратит миллиард на ИИ-образование. При этом деньги из семьи не уйдут

Xiaomi уверяют, что обошли Whisper с новой голосовой моделью MiDashengLM-7B
Perplexity интегрировали в соцсеть Трампа

Truth Social запустила бета-версию ИИ-поиска на базе Perplexity. Сделка открывает Perplexity доступ к нескольким миллионам пользователей Truth Social, активной в интернете и лояльной Трампу аудитории.

Сложно точно сказать, почему платформа предпочла стартап. Вероятно, сыграла роль архитектура интеграции: Perplexity предоставляет поисковую платформу (Sonar API), а конфигурацией – пулом источников, подсказками и стилем ответов – управляет сам клиент.

Такое b2c партнёрство – шанс для Perplexity увеличить аудиторию и узнаваемость. Платформа сейчас обрабатывает 780 млн запросов в месяц, меньше Google или ChatGPT, и доступ к базе пользователей Truth даст возможность показать рост инвесторам.

Тесты журналистов показали, что Truth Search AI ограничивает пул источников (ссылается на Fox, The Federalist и другие республиканские медиа). Perplexity говорят, что клиент делает это самостоятельно через API и компания не имеет отношения к политике сервиса.

Несмотря на ограничения, в отдельных медиа уже гадают, долго ли продержится Perplexity на новом месте: Truth Search AI готов выдавать неприятные для администрации Трампа результаты, пишет о сокращении ВВП, росте инфляции и негативном влиянии тарифов на экономику. Шутят, что в соцсеть Трампа интегрировали тот самый “woke” ИИ, с которыми администрация собиралась бороться.
👍2😁2
Nvidia теряет Китай

Весной США ввели лицензирование экспорта H20 в Китай и закрыли Nvidia доступ к китайскому рынку «в целях нацбезопасности». И если ещё пару лет назад Nvidia почти безраздельно властвовала на китайском рынке ИИ-чипов, занимая до 95% сегмента, то после весенних ограничений эта доля упала примерно до половины, а за один только квартал выручка из Китая просела на 4,5 миллиарда.

И вот Nvidia спешно возвращает H20 в Китай, согласившись ради этого на очень жёсткие условия. Financial Times пишут, что 15% выручки от продаж в Китае будет идти в бюджет США – это условие выдачи экспортных лицензий, и с этими условиями Nvidia и AMD уже согласились.

Правда, вот незадача – Китай не спешит пускать их обратно. Причины понятны – там уже привыкли, что американские «партнёры» могут вдруг их кинуть по первому слову властей США, а санкции заставляют их уходить с рынка даже в ущерб собственным интересам, разрывая существующие договорённости и цепочки поставок. Стратегия, чтобы не пустить Nvidia, также придумана – звучит мысль, что их чипам нельзя доверять, а государственные медиа Китая обвиняют Nvidia в «закладках» и бэкдорах.

Местные игроки не сидели сложа руки. Пока Nvidia пыталась договориться с Вашингтоном, в Китае начали активно заполнять возникший вакуум. Huawei, Biren, Cambricon, MetaX, Iluvatar ускорили разработки и начали заключать новые контракты. К примеру, Iluvatar уже выпускает 7-нм GPU, сопоставимый (по заявлению компании) с Nvidia A100. По прогнозу Bernstein, к 2027 году доля китайских чипов вырастет с 17% до 55%, а власти подогревают процесс, открыто призывая меньше зависеть от Nvidia и быстрее переходить на продукты местных производителей.

Для Nvidia каждый потерянный контракт в Китае (а теперь и 15% каждого заключённого) это недополученная прибыль на некогда важнейшем рынке, которая не пойдёт на НИОКР и разработку новых технологий. В итоге прав оказался Дженсен Хуанг, который предупреждал Трампа, что если уйти с китайского рынка – есть риск отстать и дать возможность развиться Китаю.
👍5🔥3
ElevenLabs запускает музыкальный сервис

Компания ElevenLabs, известная по сервисам генерации речи и голосов, теперь берётся за целые песни – у них появился Eleven Music, прямой конкурент Suno

Не обошлось без собственного УТП – сооснователь компании Мати Станишевски заранее договорился с правообладателями Merlin, Kobalt, SourceAudio, чтобы построить «лицензионный» подход и обучать модель только на лицензированных треках.

Важно, что без подписки треки нельзя скачать или использовать, несмотря на наличие бесплатных кредитов. Есть ещё ряд ограничений (например, нельзя использовать имена исполнителей или названия треков). В итоге риски получить иск снижаются, но всё равно не исчезают полностью.

Правда, есть подозрение, что использование сервисом только узкого пула лицензированных треков повлияло и на качество результата. Хотели сравнить с конкурентами, но запустить Eleven Music так и не получилось – сервис видит подмену IP-адреса и запрещает генерации.

Обещают, что подписка решит эту проблему – но зачем давать деньги им, когда можно купить подписку на Suno? Сервис отлично работает в России, обучен на большем числе треков и давно на рынке, а «правильная» лицензия ещё никакой ИИ-компании не помогала завоевать рынок.
Apple снова меняет траекторию

Apple долго держалась за осторожную стратегию в искусственном интеллекте: никаких модных чатботов, последовательная интеграция функций на базе ИИ в приложения, умные функции прямо на устройстве, чтобы не жертвовать приватностью. Как показала практика, такой подход не понравился ни юзерам, ни инвесторам, которым хотелось инновационных и понятных ИИ-продуктов вроде ChatGPT или Gemini.

Поэтому в последнее время позиция изменилась. Тим Кук прямо сказал, что компания собирается «существенно» увеличить траты на ИИ и готова к крупным покупкам. Речь идёт не только о найме специалистов, но и о строительстве собственных дата-центров.

В кулуарах обсуждали покупку Perplexity – поискового стартапа с «ответным» интерфейсом, который сейчас оценивается в 14 миллиардов долларов. Рассматривали и мягкий вариант – партнёрство, чтобы встроить технологию в Safari или Siri. Это могло бы снизить зависимость от Google в поиске и добавить недостающие нейроответы. Но Perplexity публично заявляли, что о сделке ничего не знают.

Параллельно компания строит собственную систему «ответов» – внутри она известна как Answers или AKI. Идея проста: пользователь задаёт вопрос, а Siri или Safari сразу выдают готовый ответ, используя данные из интернета. Это должно подстраховать ситуацию, пока «большая» Siri готовится к переезду на новую архитектуру.

Apple одумались и теперь пробуют параллельно разные подходы: переговоры о M&A, разработка собственного движка нейроответов, архитектурный апгрейд Siri, вложения в чипы и дата-центры.
1👨‍💻4
2025/10/27 08:51:54
Back to Top
HTML Embed Code: