Telegram Web Link
Драма с противостоянием Cloudflare и нейропоиска продолжается.

Теперь Cloudflare накинулись на Perplexity. Они заявляют, что сервис целенаправленно обходит блокировки, маскируя своих ботов под обычные браузеры Google Chrome и постоянно меняя IP-адреса. Игнорируя, понятное дело, запреты в robots.txt. Cloudflare якобы зафиксировали миллионы таких запросов ежедневно.

В ответ представители Perplexity назвали доклад «рекламным трюком». Уже есть и стратегия защиты: трафик – не их, бот – не классический краулер, а агент, действующий по прямому запросу пользователя, а значит, правила robots.txt на него не распространяются. Тем не менее Cloudflare воспользовались предлогом, исключили стартап из списка верифицированных ботов и начали блокировать его «скрытое сканирование» по умолчанию.

Многие медиа поспешили обвинить Perplexity, а мы сразу подумали про коммерческий интерес Cloudflare – они считают ИИ-ботов «экзистенциальной угрозой для издателей» и напрямую заинтересованы в продвижении своих услуг и расширении рынка.

Могли ли Perplexity обходить robots.txt? Вероятно, и даже скорее всего – благо, на данный момент это не считается нарушением закона или неправомерным использованием авторского контента. Тем более что сам сервис бесплатный (да, компания коммерческая и есть платные подписки, но платит человек не за доступ к контенту, а за расширение функций продукта). Плохо ли это? Доказать умышленный вред и денежные потери издателей из-за нейропоиска не получится, а для пользователей это только в плюс.

Вот и остаётся пытаться выставить эти компании своего рода «мошенниками», которые под «маскировкой» проникают на сайты издательств за контентом. Поэтому когда Cloudflare говорят про обход robots.txt – они, вероятно, правы. И когда Perplexity говорят про «рекламный трюк» – они тоже правы. Наблюдаем очередной виток конфликта между основанной на кликах бизнес-моделью отдельных издательств и наступившей эпохой ИИ. Пока, по ощущениям, ИИ побеждает.
👍4🫡2
В сети уже есть первые генерации сервиса Grok Imagine от Илона Маска. Он, конечно, обещает, что модель будет всё время улучшаться – но сейчас результаты выглядят устаревшими (да, ещё до релиза). Насколько хорошо получились ИИ-компаньоны, настолько плохо – генерация видео, и вряд ли 18+ режим это спасёт.

• Картинки мыльные и искусственные, чем всегда был плох Grok

• Видео рваные, будто не хватает интерполяции кадров (примерно на уровне AnimateDiff, который можно запустить локально на компьютере)

• Физика странная, движения неестественные

• Генерация звука – отдельный разговор. Скорее всего это отдельная нейросеть, которая справляется не очень, не умеет генерировать озвучку, посредственно учитывает контекст на экране. Сильно хуже Veo 3, с которой сервис зачем-то сравнивают

И эти минусы прослеживаются почти на всех опубликованных в X видео. Да, скорость генерации и интерфейс с бесконечной прокруткой действительно впечатляют, но качество работы посредственное. Сопоставлять это с тем, что делают Google или даже OpenAI смысла нет.

Акцент сделан на коммьюнити X – со всеми вытекающими: отсутствием цензуры, очень странным режимом 18+ и акцентом на мемы и оживление фотографий. Попытка воссоздать Vine на базе ИИ – это, конечно, хорошо. Но это уже сделали в том или ином виде Шедеврум и Sora. Пока велик шанс, что получится очень странная и токсичная платформа для фанатов Маска.

P.S. Вот даже интересно, что будет делать Маск, когда на его платформе начнут генерировать голые дипфейки реальных людей? Это же не какой-то Вася Пупкин с сервером на 100 человек в гараже, а одна из крупнейших соцсетей в мире. Кажется, скандалов ещё будет много.
1🔥3👏1
Media is too big
VIEW IN TELEGRAM
Google DeepMind выпустила Genie 3 – первую модель, которая генерирует интерактивные миры в реальном времени.

• Нужно описать текстом желаемую локацию или события, и система их создаст.
• Есть возможность перемещаться и взаимодействовать с предметам.
• Ключевая фишка, почему это работает – согласованность: модель запоминает каждую локацию и воспроизводит её при повторном посещении.
• Система поддерживает «промптируемые события» – можно изменить погоду, добавить объекты или персонажей прямо во время взаимодействия.

Потенциал для генерации игр, фильмов и данных огромный, а рост по сравнению с предыдущей версией такой, что даже не верится.

Но игры в реальном времени всё ещё появятся не скоро:
• «память» работает только несколько минут, потом мир будет сгенерирован заново.
• набор действий примитивный – навигация и простые манипуляции.
• модель плохо работает с реальными географическими локациями и рендерингом текста.
• нет мультиплеера
• не понятно, сколько это стоит – но есть ощущение, что космически дорого

Попробовать самим нельзя – сейчас DeepMind запускает закрытое превью для исследователей.
🔥3
Время перестать залипать в чаты и готовиться ко сну? Вот и OpenAI так решили, добавив в ChatGPT напоминание о том, что нужно сделать паузу во время долгих бесед с ИИ. Воспроизвести, правда, пока не получается.

Ещё ChatGPT перестанет давать категоричные жизненные советы. На вопрос «Можно всё бросить и уехать в Тайланд?» он теперь не должен четко отвечать «да» или «нет», подтолкнув к размышлениям и самостоятельному поиску ответа.

Такая вот реакция OpenAI на критику – в последнее время появилось много странных кейсов, когда люди в ИИ видят друга, любовь всей жизни, психолога или даже бога. Есть ощущение, что человек в данном случае приходит к чат-боту уже не совсем здоровым и его ситуация – не вина ИИ, но компании от этого не легче.
Forwarded from Content Review
Дипфейки и симулякры

Утренняя реплика Илья Власова о бургерах, которые никто не готовил, и моделях, которые не существуют

Бодрийяр в своё время придумал концепцию симулякра, копии без оригинала. Тут не философский канал и мы не философы, но его изложение этой концепции относительно конструирующих реальность медиа кажется ещё более актуальным в эпоху искусственного интеллекта. Генеративный ИИ выступает как конвейер на пути между второй (где за образом ещё стоит вещь) и третьей (где эта вещь исчезает) стадиями бодрийяровской эволюции.

Возьмём, к примеру, Uber Eats. Недавно сервис ввёл новую генеративную функцию для улучшения фотографий блюд в меню. Она может переложить бургер на красивую тарелку, поменять фон, освещение, дорисовать недостающие ингредиенты или даже увеличить порцию (чуть заметно, само собой, чтобы не нарушать закон). Едва ли нас можно удивить тем, что товар на картинке в интернете отличается от своего реального прототипа – но тут скорее важно, что сейчас этот процесс автоматизирован и поставлен на поток, а обрабатываются (за вознаграждение) даже загруженные юзерами фотографии. Зачем это нужно, догадаться не сложно – такие фото повышают конверсию покупок на 15-30%.

В другой ситуации арендодатель с Airbnb попытался стрясти денег с арендатора за порчу имущества, прикрепив… Сгенерированную картинку. Просто мошенничество, скажете вы – но тут дело в том, что раньше подобное было скорее редкостью, ведь нужно учить Фотошоп или нанимать специально обученного человека. А тут загрузил в ChatGPT, попросил добавить трещину на предмет – и готово. Платформа поверила арендодателю на слово, даже не почесавшись для перепроверки и явно недооценивая подобные риски.

Третья ситуация оказалась у всех на слуху – речь про Vogue и их рекламу Guess с нейромоделью. Здесь уже ситуация интереснее, потому что фешн начинает, уходя ещё дальше от реальности, превращаться в условный конструктор сайтов, где надо добавить несколько блоков (наряд, типаж, цвет глаз, длина волос, фон…) – и получить нужный результат.

Картинка еды в приложении – это генеративная симуляция блюда, которое никто не готовил. Виртуальная модель в глянце – симуляция образа человека, сконструированная из набора заданных токенов. Мы уже приближаемся к миру, который Жан Бодрийяр называл «царством симулякров», маскирующих отсутствие настоящей реальности и в итоге вымещающих её. Возникает почти гиперреальная ситуация: мы чаще взаимодействуем не с вещами, а с их цифровыми образами; не с едой, а с представлением о еде; не с людьми, а с виртуальными образами.

Рестораны всё ещё готовят бургеры, и Nike по-прежнему шьёт кроссовки – но маржа смещается к цифровому слою, а воспринимаемая ценность отрывается от материала. Инструменты редактирования «реальности» становятся доступны по клику и станут ещё доступнее с появлением AR-очков и имплантов, а проверка на достоверность остаётся дорогой и сложной. В конце концов все образы, которые можно заменить красивой моделью (визуальной, речевой, поведенческой) – вероятно, будут заменены. Потому что это дешевле, масштабируемо и, что важно, достаточно похоже.

#утренняяреплика
🔥6
Сбер объявил о выделении 1 миллиарда рублей на поддержку новых образовательных программ в сфере ИИ и ИТ. Выглядит красиво – деньги пойдут 6 ВУЗам на 14 программ, по итогу должно появиться 2200 новых специалистов. Кого-то может смутить итоговый расклад в 450 тысяч за 1 нового специалиста, но это не такие уж большие деньги.

Смешно другое. Деньги, как это водится, из семьи не уйдут. Какую-то – подозреваем, что большую – часть направят на обучение преподавателей на площадке Сбера. Очевидно, что обучать их будут не Perplexity с Gemini, а Гигачату с Кандинским. Как говорится, ИИ есть у нас дома.

При этом стоит помнить о том, что современные ИИ-технологии – это не про искусственный интеллект, а про более продвинутую автоматизацию и алгоритмы. К сожалению, текущее развитие ИИ-технологий позволяет лишь копировать и компилировать то, что было создано человеком. Ну, или другим генеративным сервисом.
😁4🤯3
Аишка
что будет делать Маск, когда на его платформе начнут генерировать голые дипфейки реальных людей?
Что и требовалось доказать – The Verge пишут, что Imagine от Grok раздел Тейлор Свифт. Это было быстро, сервис ещё даже толком релизнуть не успели.

Илон Маск зачем-то переизобретает CivitAI…
3🍾3😁1
Xiaomi представила свою голосовую нейросеть MiDashengLM-7B. Модель обучена на миллионе часов аудио и уже обходит OpenAI Whisper (лидер рынка) в ряде задач. Главное, что она помимо речи различает звуки, музыку и реагирует (по заявлениям разработчиков) быстрее аналогов.

Звучит как задел на будущее, где с машиной можно будет разговаривать как с человеком. Управление сиденьями, маршрутами, даже взаимодействие с другими автомобилями – всё это станет частью голосового интерфейса нового поколения.

Подробнее расписали в Электричке.
Удобно
😁10
«Grok 5 выйдет до конца этого года и будет невероятно хорош» – Маск

P.S. Представили лицо инженеров xAI, которые из твита узнали, что работать придётся в 2 раза больше и начинается очередной аврал
1😁9
Было/стало. Как-то даже грустно, больше не целый зоопарк. И люди перестанут спрашивать, какой моделью пользоваться
2💘53
Итак, случилось – OpenAI представила GPT-5. Теперь это новая основная модель ChatGPT.

Если коротко, то почти все утечки, о которых мы писали раньше – подтвердились. Модель стала:
• гибридной (сама решает, когда и как долго «думать»)
• мультимодальной (понимает картинки, как GPT-4o). Правда, аудио и голосовой режим пока работают на том же GPT-4o.
• с новыми агентными инструментами
• с более длинным контекстом (400 тысяч токенов суммарно)
• с меньшим количеством галлюцинаций
• бесплатной (с ограничениями).

Теперь чуть подробнее. Формально это «унифицированная система», но по сути речь о гибридной архитектуре, которую первой в массовом формате показали Anthropic в Claude. Если раньше приходилось выбирать между условным o3, который лучше справлялся с поиском и сложными задачами, и 4o, который быстрее и лучше писал тексты, то теперь ChatGPT сам выбирает режим: быстрый и дешёвый или медленный, с «долгим размышлением».

Мы, кстати, давно писали, что индустрия движется к гибридному подходу и почему это хорошая тенденция, а «режим рассуждений» априори благом не является.

Параллельно OpenAI решают проблему, которую сами же создали – вместе с зоопарком моделей, непонятных большей части пользователей с личной жизнью. Про их нейминг давно ходят мемы – 4o, o3, o4, 4.1, 4.5 и ещё куча версий зачем-то существовали одновременно в рамках единого интерфейса. Теперь всё спрятано под капот.

Из дополнительных обновлений – появились предустановленные «личности», от циничной до поддерживающей (привет, Grok… 18+ режима нет), улучшенный голосовой режим, интеграция с Gmail и Google Calendar для Pro-пользователей. Правда, насчёт интеграции не понятно – а в чём новость? Потому что она была доступна и раньше, через экран «коннекторов» в настройках, да и у конкурентов вроде Claude давно есть.

Что с ценой? Утечки, что модель будет бесплатной для всех пользователей, подтвердились – можно использовать даже без подписки. Но с лимитами – 10 сообщений за 5 часов, дальше переключение на версию mini. Цена API в целом стала ниже.
1👍41
Судя по всему, вот что бывает, когда слайды делает ИИ «уровня доктора наук» (если кто-то ещё не пропускает мимо ушей эти маркетинговые формулировки). Ну что же, подождём, пока он станет «заслуженным академиком»

P.S. Обещаем, что это последний пост про GPT-5 на сегодня
😁5
2025/10/22 03:06:37
Back to Top
HTML Embed Code: