Telegram Web Link
⚡️Essential AI сделали открытие: рефлексия у ИИ появляется раньше, чем мы думали

Стартап Ашиша Васвани (он один из авторов знаменитой работы Google "Attention Is All You Need") представил доказательства того, что одна из ключевых когнитивных способностей языковых моделей — рефлексия, или способность анализировать и исправлять собственные рассуждения — появляется значительно раньше в процессе обучения, чем считалось до сих пор.

До настоящего времени в сообществе преобладало мнение, что рефлексия, формируются преимущественно на этапе обучения с подкреплением, но исследователи из Essential AI установили, что даже модели, находящиеся на ранних этапах предварительного обучения, демонстрируют зачатки рефлексивного мышления.

Более того, эта способность стабильно усиливается по мере продолжения обучения, показывая высокую корреляцию (0,76) между точностью рефлексии и объёмом вычислительных ресурсов.

Особенно интересным в исследовании оказался тот факт, что простое слово "Wait,", добавленное к промпту, значительно улучшает способность модели распознавать ошибки в рассуждениях и исправлять их
.

Данное открытие имеет несколько важных последствий:

1. Пересмотр архитектуры обучения — возможно, следует уделять больше внимания качеству предварительного обучения, а не полагаться исключительно на последующие этапы для развития продвинутых когнитивных способностей.

2. Экономия ресурсов — понимание того, что рефлексия развивается органически в процессе предварительного обучения, может помочь более эффективно распределять ресурсы между этапами обучения и вывода.

3. Новые методы обучения — исследователи могут разработать специальные методики для стимуляции рефлексивных способностей на ранних этапах обучения.

Авторы исследования подчёркивают, что необходимо дальнейшее изучение того, как эти зачатки рефлексии переходят в более сложные формы рассуждений при дальнейшем обучении. Они также отмечают, что предстоит выяснить, какие именно наборы данных и методы обучения наиболее эффективно способствуют развитию рефлексивных способностей.
🔥106👍6
Рэй Далио считает, что не надо отвлекаться на тарифы Трампа и их влияние на рынки и экономику, так как из-за этого упускаются более важные моменты

Один из богатейших людей мира Рэй Далио утверждает, что мы наблюдаем распад мирового порядка — монетарного, политического и геополитического.

Он выделяет 5 основных сил, которые сейчас формируют ситуацию:

1. Распад экономического порядка из-за слишком большого существующего долга и неустойчивых отношений между странами-должниками (как США) и странами-кредиторами (как Китай). Старая система, где Китай производит дешёвые товары для Америки, а Америка накапливает огромные долги, становится неустойчивой в эпоху деглобализации.

2. Распад политического порядка из-за огромных разрывов в уровне образования, возможностях, производительности, доходах и ценностях людей. Это приводит к конфликтам между правыми и левыми популистами, что подрывает демократию, требующую компромиссов и соблюдения закона.

3. Распад международного геополитического порядка, поскольку эра доминирования одной державы (США) заканчивается. Мировой порядок под руководством США заменяется подходом, где правят сила и односторонние интересы.

4. Разрушительное влияние природных явлений (засухи, наводнения, пандемии).

5. Изменения в технологиях, таких как ИИ будут сильно влиять на все аспекты жизни. ИИ будет иметь огромное влияние на все 4 вышеперечисленных аспекта.

Далио говорит, что происходящее сейчас — это современная версия того, что уже многократно случалось в истории.
👍22🔥10🤔5🌚2💊2💯1
Джефф Безос инвестирует в секретный стартап электромобилей Slate Auto

Основатель Amazon инвестирует в этот стартап через свой семейный офис. Slate Auto был основан в 2022 году и сохранял секретность до недавнего времени, набирая сотни сотрудников от крупных автопроизводителей(Ford, GM и др.)

Компания планируют выпускать доступный двухместный электрический пикап стоимостью около $25,000.

Производство может начаться уже в конце 2026 года возле Индианаполиса.

Компания привлекла $111 миллионов в раунде Series A в 2023 году.

У Slate многие менеджеры пришли из Amazon, включая бывших высокопоставленных сотрудников, близких к Безосу.

У стартапа необычная бизнес-модель - они начинают с доступного автомобиля, а не с премиум-сегмента, как большинство стартапов электромобилей.

Они планируют дополнять низкую маржу от продажи автомобилей высокомаржинальными аксессуарами и одеждой.
👍7👌73💊3❤‍🔥2
Новый игрок на рынке - Deep Cogito создал ИИ-модели за 75 дней, превосходящие Llama 4

Стартап также
запустил Cogito v1 Preview — семейство ИИ-моделей (3B-70B параметров)с открытым исходным кодом, которые, якобы, превосходят лучшие доступные модели с открытым исходным кодом того же размера, включая Llama 4.

Разработчики говорят, что
модели обучены методом Iterated Distillation and Amplification (IDA)
- позволяет преодолеть ограничение "интеллект модели не может превысить интеллект создателя".

Модели созданы на основе предобученных чекпойнтов Llama и Qwen.

Весь процесс занял всего 75 дней силами небольшой команды.

Производительность 70B модели превосходит Llama 4 109B MoE.

IDA описывается как революционный метод, но, по мнению экспертов, может оказаться просто дистилляцией в стиле R1 с многоходовым поиском.

Отсутствуют технические детали.

Также команда говорит о необходимости всего 2-х элементов для достижения AGI-продвинутое рассуждение и итеративное самосовершенствование.

Все это выглядит чрезмерно упрощенным.

Если Deep Cogito действительно нашли способ создавать конкурентоспособные модели за короткий срок и с меньшими ресурсами, это может серьезно изменить ландшафт ИИ-индустрии. Демократизация создания сильных моделей снизит барьер входа для небольших компаний.
4👍4🔥2🤔2
Огромный рынок, о котором никто не говорит

Относительно понятно как управлять людьми. Гораздо сложнее управлять десятками, сотнями, тысячами или миллионами ИИ-агентов.

Как вы будете отслеживать работу, которую они выполняют?

Огромный рынок будет создан вокруг управления агентами.
👍14🤔74🔥3👌3🤣3🌚1
⚡️Студенты делегируют ИИ когнитивные задачи. Образование на пороге революции - исследование Anthropic об использовании ИИ студентами

Anthropic опубликовала масштабное исследование о том, как 1млн студентов используют их ИИ-ассистента Claude. Это одно из 1-х исследований, основанных на анализе реальных данных, а не на опросах/лабораторных экспериментах.

Исследователи обнаружили несколько тревожных и в то же время интересных тенденций, которые могут полностью изменить ландшафт высшего образования:

1. Студенты используют ИИ преимущественно для решения задач высшего когнитивного порядка — создания (39,8%) и анализа (30,2%).

Это полностью переворачивает таксономию Блума, согласно которой образование должно начинаться с простых когнитивных функций и постепенно переходить к более сложным.

Представьте себе пирамиду, стоящую на вершине. Именно так выглядит современное использование ИИ в образовании — студенты делегируют машинам самые сложные интеллектуальные операции, оставляя себе более простые.

2. Технологический разрыв между дисциплинами
Исследование выявило значительный дисбаланс: студенты информатики составляют почти 40% пользователей Claude, хотя представляют лишь около 5% от общего числа выпускников в США. Это говорит о формировании "двухскоростного" образования, где одни специальности быстро интегрируют ИИ, а другие отстают.
Такой разрыв может привести к неравенству нового типа, когда конкурентное преимущество получат именно те выпускники, которые научились эффективно использовать ИИ в своей области.

Anthropic выделил 4 основных паттерна взаимодействия студентов с ИИ:


1. Прямое решение проблем — студент запрашивает готовый ответ на конкретный вопрос
2. Прямое создание контента — студент просит ИИ написать эссе или создать презентацию
3. Совместное решение проблем — студент вовлекается в диалог с ИИ для поиска решения
4. Совместное создание контента — студент и ИИ вместе работают над созданием материала.
Все 4 модели представлены примерно в равных пропорциях, что говорит о разнообразии способов использования ИИ в образовательных целях.

Стратегические вызовы для системы образования

1. Кризис оценивания
Около половины взаимодействий студентов с ИИ имеют "прямой" характер — получение готовых ответов или создание готового контента. В таких условиях традиционные методы оценки знаний и навыков становятся неэффективными. Как оценивать работу, если невозможно определить, что сделал студент, а что — ИИ?

2. Переопределение целей образования
Если ИИ может анализировать и создавать лучше людей, возникает вопрос: чему именно должны учиться студенты? Вероятно, акцент должен смещаться в сторону мета-навыков: умения формулировать проблемы, критически оценивать полученные от ИИ результаты, интегрировать знания из разных областей.

3. Риск когнитивной зависимости
Исследование выявило тревожную возможность "когнитивного аутсорсинга", когда студенты могут полностью передать сложные интеллектуальные задачи искусственному интеллекту. Это создает риск формирования поколения специалистов, неспособных самостоятельно мыслить без помощи ИИ.

Результаты исследования указывают на необходимость переосмысления образовательной системы на всех уровнях:

Для университетов: разработка новых методов оценивания, учитывающих реальность использования ИИ; интеграция обучения работе с ИИ в учебные планы всех специальностей.

Для преподавателей: переход от роли источника знаний к роли наставника, помогающего студентам развивать критическое мышление и этическое использование ИИ.

Для разработчиков ИИ: создание специализированных образовательных инструментов, которые не просто дают ответы, но способствуют обучению. Anthropic уже экспериментирует с "Режимом обучения", основанным на сократическом методе.

Для регуляторов: разработка стандартов и рекомендаций по интеграции ИИ в образовательный процесс, учитывающих этические аспекты и риски когнитивного аутсорсинга.
🔥17👍15👀63
Экономика стейблкоинов, кто на самом деле зарабатывает на USDC?

В свете недавней подачи заявки S-1 на IPO компанией Circle (эмитент USDC) раскрылись интересные данные о реальной экономике стейблкоинов, которые заставляют переосмыслить этот бизнес.

Прежде всего, впечатляют масштабы:

$60 млрд в обращении
>$1 трлн выпущено за все время существования
$25+ трлн общий объем транзакций
$1.7 млрд выручки в 2024 году.

На каждый $1млн USDC в обращении Circle получила всего $4,700 в 2024 (против $8,900 в 2023), но заплатила партнерам $30,300 (против $23,600).

Circle нужно $212.8 млн USDC в обращении чтобы заработать всего $1 млн прибыли. Поэтому для годовой прибыли в $156 млн требуется $60 млрд в обращении.

Кто на самом деле зарабатывает?
Coinbase. Биржа получает от USDC $684 млн прибыли — более чем в 2 раза больше чем сам эмитент Circle ($285 млн).

При этом Coinbase:
- Не несет регуляторных рисков
- Не отвечает за сохранность резервов
- Не сталкивается с юридическими рисками эмитента

Coinbase получает:
100% с USDC на своей платформе
50% с USDC вне Coinbase

99.1% выручки
Circle — это проценты по резервам. Это скорее "ставка на процентные ставки", чем технологическая инновация.

В финансах посредники по-прежнему зарабатывают больше создателей.

История Circle показывает, что эмиссия стейблкоинов может быть хорошим бизнесом только при колоссальных масштабах, но даже тогда большую часть экономической выгоды могут получать партнеры по дистрибуции.
👍115🤔3💯2😢1
Google выпустил фреймворк для ИИ-агентов, чтобы они работали между собой в разных экосистемах, независимо от платформы или разработчика.

Основные характеристики Agent2Agent:

1. Универсальная совместимость агентов и открытый исходный код.

2. Создан для корпоративных задач

3. 5 основных принципов дизайна:
- Агентоцентричность: не требуется общая память/инструменты
- Соответствие стандартам: HTTP, JSON-RPC, SSE
- Безопасность по умолчанию
- Поддержка как коротких, так и длительных задач
- Независимость от модальности — от видео до текста

4. Дополняет MCP от Anthropic.

Пример практического применения:

При найме персонала один ИИ-агент может искать кандидатов, другой заниматься планированием, а третий — проверкой данных, все в рамках одного агентского интерфейса.
1🔥11👌53😁2🤔1
⚡️Создана 1-я в мире детальная карта нейронных связей мозга мыши. Это историческая веха, которая поможет понять механизмы интеллекта.

7 лет работы, более 150 ученых, 1,6 петабайта данных — человечество получило 1-ю в истории подробную карту мозга с указанием не только где и как соединены нейроны, но и как они работают.

Мозг — последняя великая загадка науки. Мы отправляем роботов на Марс, но до сих пор плохо понимаем, что происходит в нашей собственной голове.

3D карта мозга мыши — первый шаг к пониманию гораздо более сложного человеческого мозга. Ученые уже изучают данные, чтобы расшифровать "алгоритмы", по которым работает мозг.

Это сделано в рамках проекта MICrONS. Туториал тут.
Статья в Nature тут.

В карте:
200,000 нейронов
523 миллиона связей
Функциональные данные о 75,000 нейронов .

Новая карта мозга поможет:

1. Разработать лекарства от болезней
2. Создать новое поколение компьютеров и ИИ
3. Понять, как формируются наши мысли и решения
4. Расшифровать загадки сознания

Для создания этой карты были использованы:

- Мощнейшие микроскопы
- ИИ для обработки изображений
- Системы работы с гигантскими объемами данных

- Цифровой двойник мозг
2🔥309👏2😁2💊2❤‍🔥1👍1
Google создал свой самый продвинутый ИИ-чип, конкурент Blackwell от Nvidia. У многих возник вопрос - разработан ли этот чип с помощью ИИ AlphaChip?

Возможно, завтра Google раскроет детали, Джефф Дин анонсировал некоторые сюрпризы.

Новый TPU Ironwood знаменует переход в новую эру вычислений - в эпоху инференса. Это чип для ИИ, которые умеют рассуждать.

Если AlphaChip действительно был использован для проектирования Ironwood, мы наблюдаем пример "замыкания цикла": ИИ помогает создавать чипы, которые, в свою очередь, будут использоваться для запуска более мощных моделей ИИ.

Ironwood - радикальный скачок в производительности и эффективности:

Колоссальная вычислительная мощность: 4614 ТФЛОПС на чип

Масштабируемость: до 9216 чипов в одном кластере, обеспечивающих 42,5 экзафлопс (в 24 раза больше, чем у самого мощного суперкомпьютера El Capitan)

Память: 192 ГБ HBM на чип с пропускной способностью 7.4 ТБ (против 8 ТБ/с у Blackwell от Nvidia)

Пропускная способность памяти: 7,2 Тбит/с (в 4,5 раза выше)

Межчиповые соединения: 1,2 Тбит/с (против 1.8 ТБ/с у NVLink 5 в Blackwell)
Энергоэффективность: в 2 раза лучше, чем у Trillium, и в 29 раз лучше первого Cloud TPU.
🔥13👍1043
⚡️Google создали ИИ,который превзошел врачей первичной медицинской помощи в симулированных медицинских консультациях

Исследователи из Google Research, Google DeepMind и Google Health опубликовали 2 научных исследования в журнале Nature о ИИ под названием AMIE.( тут и тут)

AMIE — это система диагностического ИИ, основанная на LLM, которая:

1. Превзошла врачей первичной медицинской помощи в симулированных медицинских консультациях по нескольким параметрам, включая точность диагностики, обоснованность назначенного лечения и, что особенно важно, способность проявлять эмпатию.

2. Показала лучшие результаты, чем клиницисты, при решении сверхсложных диагностических задач, а также повысила эффективность работы врачей при использовании в качестве вспомогательного инструмента.

AMIE есть агентные возможности:
1. Система может проводить симулированные медицинские консультации
2. Демонстрирует способность рассуждать при выборе методов лечения
3. Проявляет эмпатию в общении
4. Может функционировать как "со-доктор" или "коллаборатор".
🔥13👍94🤔2
Вот это шаг! Стартап Ильи Суцкевера будет использовать новый TPU от Google

Google заключил партнерства с венчурными фондами и акселераторами, предоставляя доступ к своим TPU лучшим ИИ-стартапам через свою облачную инфраструктуру, формируя экосистему, где стартапы не просто используют их облачные сервисы, а становятся зависимыми от TPU.

Тем самым:


1. Google начинают сбор данных о передовых сценариях использования. Стартапы часто работают над инновационными применениями ИИ, которые Google может изучать.

2. NVIDIA доминирует на рынке ИИ-ускорителей с их GPU, предоставляя TPU стартапам, Google создает альтернативную экосистему и нарушает монополию NVIDIA.

3. Стартапы как Magic, Physical Intelligence и Safe Superintelligence работают над передовыми моделями ИИ. Google может получать ранний доступ к их инновациям или даже становиться потенциальным покупателем этих стартапов.

Safe Superintelligence работает над моделями, которые в будущем могут использоваться для проектирования следующих поколений TPU. Это создает усиливающий цикл: TPU → лучшие модели ИИ → лучшее проектирование TPU → еще лучшие TPU.

Учитывая глобальный дефицит GPU и HBM-памяти, стратегическое распределение доступа к TPU среди стартапов помогает Google контролировать, какие направления ИИ получают вычислительные ресурсы.
🔥9👍52🏆2😁1
Тарифы Трампа усиливают де-долларизацию. РФ и Китай обращаются к биткоину

Согласно анализу мировой компании по управлению инвестициями VanEck, апрельский пакет пошлин Трампа против Китая и ЕС усилил риск монетарного и геополитического фрагментирования экономики.

Как отмечает глава исследования цифровых активов VanEck Мэтью Сигел, ключевые геополитические игроки уже внедряют криптовалюты в международные расчеты:

Россия и Китай используют Биткоин для расчетов по энергетическим контрактам.

Боливия планирует импортировать электроэнергию с использованием криптовалют.

Французская EDF изучает майнинг Биткоина с использованием излишков экспортируемой электроэнергии.

В эпоху замороженных валютных резервов, политизированного доступа к SWIFT и инфляции фиатных валют, биткоин становится "Швейцарией расчетов" — безгосударственным инструментом, неподвластным играм центральных банков.

VanEck полагает, если тарифы замедлят экономический рост без роста инфляции, ФРС может снизить ставки, создавая благоприятные для биткоина условия ликвидности.
8👍7🔥2👌2🤣2👎1😁1🤨1
Новое время, когда ИИ важнее человека. В сеть слили письмо СЕО Shopify, где он требует эффективно использовать ИИ.

Он заявил, что прежде, чем просить больше людей и ресурсов, команды должны показать , почему они не могут выполнить задачи с помощью ИИ.

Более того СЕО Fiverr также отправил подобное письмо своим 1000 сотрудникам, предупреждая, что ИИ идет за их рабочими местами.

Вот основные тезисы из письма главы Shopify:

1. Использование ИИ — обязательное требование
для всех сотрудников Shopify
"Если вы не развиваетесь, вы деградируете"

2. ИИ должен быть частью фазы прототипирования GSD

3. Оценка использования ИИ будет включена в систему оценки работы

4. Сотрудники имеют доступ к передовым инструментам ИИ. Команда будет учиться и адаптироваться вместе. Время будет выделяться на интеграцию ИИ в бизнес-процессы и циклы разработки продуктов.

5. Перед запросом о дополнительных кадров команды должны доказать, почему они не могут выполнить работу с помощью ИИ.
👍11💊8🤔7🔥53
У ChatGPT появилась огромная память, которая помнит и анализирует всю историю ваших чатов.

Это новый шаг во взаимодействии ИИ с человеком. Это переход от эпизодических взаимодействий, где каждый раз нужно объяснять всё заново к развивающимся отношениям. ИИ становится компаньоном.

https://www.tg-me.com/alwebbci/3188
🔥19👍10🤔2🤨2👏1
От биологии к искусственным сенсорам->человекоподобным роботам

Учёные совершили большой прорыв - создали биологическую модель hASA из стволовых клеток, воспроизводящую сенсорные пути человека от периферии к мозгу. Эта биологическая модель интегрирует 4 типа органоидов: сенсорные, спинного мозга, таламические и корковые, имитируя передачу сигналов боли, осязания и других ощущений в человеческом организме.

Параллельно с этим, в мире робототехники происходит активное развитие технологий, имитирующих человеческие чувства. На основе последних данных мы подготовили визуализацию текущего прогресса в этой области.

Как видно из визуализации, инженеры уже достигли значительных успехов в имитации человеческого зрения (80%) и слуха (70%), в то время как осязание (65%), обоняние (50%) и вкус (45%) остаются более сложными задачами. Общий прогресс в этой области оценивается на уровне 62%.

Ключевые проекты:
- Искусственная сетчатка (Университет Центральной Флориды)
- SonicSense для обнаружения объектов через вибрации
- MIT GelPalm с электронной кожей и тактильными сенсорами
- AI Nose (Ainos & ugo) для анализа летучих соединений
- Электронный язык (Университет штата Пенсильвания).

Для полной имитации биологических возможностей человека требуется решить ещё три ключевые задачи:

1. Интеграция сенсоров с ИИ для целостного восприятия
2. Адаптивная нейропластичность в сенсорике
3. Энергоэффективность биологического уровня

Примечательно, что биологическая модель hASA и технологические разработки могут дополнять друг друга — нейробиологические исследования предоставляют фундаментальное понимание принципов работы сенсорных систем, которые затем адаптируются в инженерных решениях.

По прогнозам экспертов, к 2030 году ожидается полная имитация зрения, к 2035 — тактильных интерфейсов, а к 2040+ — полная сенсорная имитация. Эти технологии найдут применение в промышленности (85%), медицине (70%), логистике (50%), сфере услуг (40%) и продолжат стимулировать исследования и разработки (90%).

В данной работе нам помогли ИИ Deep Research Google и Claude от Anthropic.
🔥129🆒2🥰1😍1
Генпрокуратура, Росимущество и Казначейство борются за право держать изъятую крипту, ведь это не только про власть, но и про доступ к деньгам

3 ведомства тянут криптовалюты к себе:

Генпрокуратура хочет правовой возможности создавать у себя криптокошельки для изъятия активов в доход государства.

А Росимущество видит крипту как имущество и готово ею управлять.

А Казначейство считает, что криптовалюты- это "квазиденьги", значит нужно их под свой контроль.

Эта конкуренция — не просто борьба за полномочия, крипта - это актив с высокой волатильностью и потенциальной ценностью, а значит, контроль над ней дает определенную власть и ресурсы.

Пока они спорят, крипта изымается, но ее статус и нахождение неясны и неизвестны.

Вокруг криптовалюты сложились разные интересы:

1. Одна группа не торопится с законами. Крипта, особенно анонимная, удобна для теневых операций. Росфинмониторинг фиксирует такие схемы, но регулирование буксует — возможно, из-за бюрократии.

2. Другие хотят порядка. Генпрокуратура запрашивает данные у криптобирж, а Росфинмониторинг создал "финансовый профиль коррупционера" с помощью ЦБ на основе анализа больших данных.

Почему нет законов, возникает вопрос?
- Ведомства не могут поделить полномочия.
- Санкции: крипта помогает в расчетах, и регулировать надо осторожно.
- Система движется медленно — согласования тянут время.

Пока правил нет, выигрывают те, кто работает в серой зоне, и ведомства, которые уже изымают крипту без отчетности. Проигрывают — бизнес и граждане, ждущие ясности.
🤣9👍6😢3👀3🔥2💊21👏1😍1
⚡️OpenAI теперь ограничены данными, а не вычислительной мощностью. Будущий прогресс зависит от алгоритмов с лучшей эффективностью выборки.

Поскольку данные стали узким местом, то теперь главная задача - разработать алгоритмы, которые могут извлекать больше информации из того же объема данных, то есть имеют более высокую эффективность выборки.

Об этом стало известно из подкаста, в котором Сэм Альтман говорил о деталях разработки GPT-4.5.

Вот, что ещё интересного:

- для обучения GPT-4 теперь требуется всего 5-10 человек;

- ожидается более 10 миллионов запусков GPU-обучения, потенциально в полусинхронном или децентрализованном режиме.

- обнаружен тонкий баг в PyTorch (torch.sum), вызвавший проблемы на 40% обучения.

- GPT-5.5 может быть достижим алгоритмически до того, как будут достигнуты жесткие ограничения по данным.
👍75🔥4
Почему Google и Anthropic заставляют лучшие ИИ играть в Pokémon? Анализ тренда

В феврале, когда Anthropic выпустил Sonnet 3.7, они в прямом эфире на Twitch показали, как он играет в Pokémon Red.

А вчера Google заявили, что Gemini 2.5 Pro проходит Pokémon Blue тоже в прямом эфире на Twitch.

Но зачем ИИ играть в Pokémon? Давайте разберёмся, что стоит за этим явлением.

Игры Pokémon Red и Blue, вышедшие ещё в 1990-х, на первый взгляд кажутся простыми: лови покемонов, сражайся с тренерами, стань чемпионом. Но за этой простотой скрывается сложность, которая делает их идеальной тестовой площадкой для ИИ:

1. Игроку нужно планировать: каких покемонов качать, какие атаки использовать, как управлять ограниченными ресурсами. Для ИИ это тест на способность принимать решения в условиях неопределённости.
Чтобы победить, нужно думать на несколько шагов вперёд. Это проверяет способность ИИ к "рассуждениям" и оптимизации.

2. В Pokémon много случайных событий. ИИ должен уметь адаптироваться, что делает игру хорошей моделью для реальных задач, где тоже есть неопределённость.

Anthropic прямо заявили, что Pokémon Red — это отличный способ протестировать их модель Claude 3.7 Sonnet на "extended thinking" (расширенное мышление).

Модель смогла победить трёх лидеров гимов, что стало значительным прогрессом по сравнению с предыдущей версией Claude, которая даже не могла выйти из стартового города.

Хотя на первый взгляд это выглядит как забавный эксперимент, за ним стоят серьёзные цели. Игры давно используются для оценки ИИ: от шахмат (Deep Blue в 1997 году) до StarCraft (AlphaStar в 2019 году). Pokémon добавляет новый уровень сложности, потому что требует не только логики, но и импровизации. Такие эксперименты помогают понять, в чём ИИ хорош, а в чём — люди. Это может привести к новым методам, которые потом применят в реальном мире.

Не будем забывать и про поп-культурный аспект. Pokémon — это культовая франшиза, и стрим, где ИИ играет в неё, привлекает внимание.

Кто-то шутит, что "AGI достигнуто, если ИИ сохранит мастер-бол для Мьюту", а кто-то удивляется, что модель уже прокачала Бластойза до 44-го уровня. Это отсылка к легендарному Twitch Plays Pokémon (2014), но теперь вместо тысяч игроков за штурвалом — одна нейросеть.

Для компаний это ещё и маркетинг. Google и Anthropic демонстрируют, что их модели способны не только решать скучные задачи, но и справляться с чем-то, что понятно и интересно широкой аудитории.
🔥85👍5👏1🤔1🤬1
2025/07/10 22:19:45
Back to Top
HTML Embed Code: