Борис опять
https://ai-2027.com/
Я внимательно прочитал AI 2027 и думаю, что это лучший прогноз из всего, что было до сих пор.
Смотрите сами:
1. Авторы опираются на научные статьи, дают все ссылки, никаких доказательств запугиванием, все спекуляции где пришлось додумывать помечены.
2. Все выводы можно проследить до чего-то, что происходит или существует уже сейчас. То есть это хороший футуризм: экстраполяция текущих трендов.
3. Делают конкретные предсказания с цифрами и датами, так что мы сможем проверить насколько они были правы.
4. Открыто говорят о более или менее неопределенных частях сценария.
5. Опираются на предположение р
К тому же написано и сделано очень хорошо, понятно и качественно.
Лично я думаю, что во всем описанном до конца 2026 они будут правы. В конце-концов Скотт Александр много лет подряд прогнозирует будущее и развитие ИИ на superforecaster уровне и лучше большинства экспертов по ИИ. Про остальное у меня пока нет сильного мнения так как там все упирается в вопрос будет ли кумулятивное ускорение ИИ прогресса благодаря агентам или нет.
В общем, если вы из племени "опять экспонента ахаха", то советую все же прочитать, так как это сильно отличается от Situational Awareness и других прошлых эссе на тему. Можно почерпнуть новые мысли. Если вы из другого племени и вас спросят что-то прочитать про эти ваши AI риски, то можно смело кидать эту ссылку.
Смотрите сами:
1. Авторы опираются на научные статьи, дают все ссылки, никаких доказательств запугиванием, все спекуляции где пришлось додумывать помечены.
2. Все выводы можно проследить до чего-то, что происходит или существует уже сейчас. То есть это хороший футуризм: экстраполяция текущих трендов.
3. Делают конкретные предсказания с цифрами и датами, так что мы сможем проверить насколько они были правы.
4. Открыто говорят о более или менее неопределенных частях сценария.
5. Опираются на предположение р
К тому же написано и сделано очень хорошо, понятно и качественно.
Лично я думаю, что во всем описанном до конца 2026 они будут правы. В конце-концов Скотт Александр много лет подряд прогнозирует будущее и развитие ИИ на superforecaster уровне и лучше большинства экспертов по ИИ. Про остальное у меня пока нет сильного мнения так как там все упирается в вопрос будет ли кумулятивное ускорение ИИ прогресса благодаря агентам или нет.
В общем, если вы из племени "опять экспонента ахаха", то советую все же прочитать, так как это сильно отличается от Situational Awareness и других прошлых эссе на тему. Можно почерпнуть новые мысли. Если вы из другого племени и вас спросят что-то прочитать про эти ваши AI риски, то можно смело кидать эту ссылку.
Ai-2027
AI 2027
A research-backed AI scenario forecast.
Forwarded from Kali Novskaya
🌸Релизим Llama 4🌸
OSS на уровне Gemini и Deepseek
Сегодня мы релизим модели из семейства Llama 4 — Llama 4 17Bx16 experts (Scout) и 128 experts (Maverick)
🌸Что интересного:
— 10 миллионов токенов контекстного окна с отличным качеством у модели Scout
— полный размер модели 16 экспертов — 108 млрд параметров, 128 экспертов — 400 млрд
— модель мультимодальная, инпут — текст, изображения, видео
Где посмотреть:
🟣 Чекпоинты HF
🟣 Блогпост
OSS на уровне Gemini и Deepseek
Сегодня мы релизим модели из семейства Llama 4 — Llama 4 17Bx16 experts (Scout) и 128 experts (Maverick)
🌸Что интересного:
— 10 миллионов токенов контекстного окна с отличным качеством у модели Scout
— полный размер модели 16 экспертов — 108 млрд параметров, 128 экспертов — 400 млрд
— модель мультимодальная, инпут — текст, изображения, видео
Где посмотреть:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Мой друг и бывший одногруппник Антон записал для DLS лекции по детекции и их только что выложили на YouTube, вот первая:
https://youtu.be/GOEdJxG5hhQ?si=LfNo1irPkNu62YAL
(Но не единственная, там целая серия)
Это буквально лучший материал по детекции, что я знаю. Жаль, что этих лекций еще не было когда я тратил нервные клетки собирая эту информацию работая в PF. Зато у вас такой проблемы не будет
Кстати еще Антон написал суперскую серию лонгридов про эволюцию моделей YOLO и про это уже было в канале.
https://youtu.be/GOEdJxG5hhQ?si=LfNo1irPkNu62YAL
(Но не единственная, там целая серия)
Это буквально лучший материал по детекции, что я знаю. Жаль, что этих лекций еще не было когда я тратил нервные клетки собирая эту информацию работая в PF. Зато у вас такой проблемы не будет
Кстати еще Антон написал суперскую серию лонгридов про эволюцию моделей YOLO и про это уже было в канале.
YouTube
Лекция. Детекция -- введение
Занятие ведёт Броиловский Антон, специалист в области Computer Vision в различных задачах от классификации до детекции.
Ссылка на материалы занятия: https://github.com/DeepLearningSchool/part_1_ml_cv/tree/main/week_09_detection
---
Deep Learning School при…
Ссылка на материалы занятия: https://github.com/DeepLearningSchool/part_1_ml_cv/tree/main/week_09_detection
---
Deep Learning School при…
Сходил поиграть в настолки и познакомился с писателем-фрилансером на закате карьеры. Средний уровень: самая популярная книга продалась 50к копиями, несколько раз попадал в топ категорий на Амазоне.
Он рассказал, что сейчас кто-то наводняет Амазон ужасными AI-сгенерированными книгами под его именем.
Еще про то, как он сам использует AI в работе. Набрасывает идеи с ChatGPT и получает от неё предложения. Затем делает все равно наоборот, потому что ChatGPT дает идеальное представление как написал бы самый средний автор на свете.
Он рассказал, что сейчас кто-то наводняет Амазон ужасными AI-сгенерированными книгами под его именем.
Еще про то, как он сам использует AI в работе. Набрасывает идеи с ChatGPT и получает от неё предложения. Затем делает все равно наоборот, потому что ChatGPT дает идеальное представление как написал бы самый средний автор на свете.
Forwarded from AI и грабли
Please open Telegram to view this post
VIEW IN TELEGRAM
https://www.docker.com/blog/introducing-docker-model-runner/
Docker сделал llama.cpp + хранилище моделей в Docker Hub + OpenAI API из коробки, в общем докеризация моделей от докера
Docker сделал llama.cpp + хранилище моделей в Docker Hub + OpenAI API из коробки, в общем докеризация моделей от докера
https://rakhim.exotext.com/but-what-if-i-really-want-a-faster-horse
Tldr: old man yells at cloud
Интересно почему все сервисы на свете превращаются в Tiktok
Tldr: old man yells at cloud
Интересно почему все сервисы на свете превращаются в Tiktok
Принес вам инсайд: сегодня вечером на lmarena что-то выйдет 🙂
А как выйдет сделаю обзор
Upd: видимо Калифорнийским вечером :)
UPD: не мог же мой информатор меня обмануть! Ждем
А как выйдет сделаю обзор
Upd: видимо Калифорнийским вечером :)
UPD: не мог же мой информатор меня обмануть! Ждем
Please open Telegram to view this post
VIEW IN TELEGRAM
Моя сеть анонимных информаторов не обманула (спасибо, Леха)
На lmarena появился лидерборд LLM для поиска. Первое место делят Gemini Pro 2.5 и Perplexity Sonar Reasoning Pro. В целом весь топ занимают модели Perplexity и Google. Модель OpenAI на седьмом месте.
https://x.com/lmarena_ai/status/1911842298914328959
На lmarena появился лидерборд LLM для поиска. Первое место делят Gemini Pro 2.5 и Perplexity Sonar Reasoning Pro. В целом весь топ занимают модели Perplexity и Google. Модель OpenAI на седьмом месте.
https://x.com/lmarena_ai/status/1911842298914328959
Яндекс тестирует reasoning-модель YandexGPT 5 в чате с Алисой — для России это первая такая модель. Правда, пока что в бете.
Работа над моделью ещё идет. В посте на Хабре описывают с чем экспериментируют, например: RL после SFT-этапа и GRPO как в R1. Для того, чтобы собрать датасет и получить больше фидбэка от пользователей, дают возможность параллельно тестировать DeepSeek-R1. Альтернатива не только хороша для пользователей, но и в целом для компании. Молодцы, что используют открытые решения наряду со своими.
Бенчмарков пока нет и скорее всего не будет до выхода модели из беты. Но шум от Deepseek R1 и o3 моделей OpenAI был неспроста: reasoning модели действительно лучше справляются в некоторых задачах. Например, кстати, в поиске, как показал новый лидерборд арены, где на первом месте reasoning модель от Perplexity.
Напомню, что reasoning модели отличаются от обычного chain-of-thought специальным этапом тренировки с помощью reinforcement learning. Предполагается, что reasoning модель способна раскладывать задачу на подзадачи, и чем дольше она "думает" над задачей, тем лучше ответ. Это, конечно, не всегда так. Существует множество работ, указывающих на то, что процесс рассуждений модели может и не иметь прямого отношения к выводам. Но в некоторых задачах reasoning модели приносят ощутимый результат и даже вне своей весовой категории. Например, я сам видел как в одной продакшн-задаче маленькая модель с ризонингом от большой компании G победила фронтир модель без reasoning от большой компании A с отрывом в 0.2 F1-Score.
Работа над моделью ещё идет. В посте на Хабре описывают с чем экспериментируют, например: RL после SFT-этапа и GRPO как в R1. Для того, чтобы собрать датасет и получить больше фидбэка от пользователей, дают возможность параллельно тестировать DeepSeek-R1. Альтернатива не только хороша для пользователей, но и в целом для компании. Молодцы, что используют открытые решения наряду со своими.
Бенчмарков пока нет и скорее всего не будет до выхода модели из беты. Но шум от Deepseek R1 и o3 моделей OpenAI был неспроста: reasoning модели действительно лучше справляются в некоторых задачах. Например, кстати, в поиске, как показал новый лидерборд арены, где на первом месте reasoning модель от Perplexity.
Напомню, что reasoning модели отличаются от обычного chain-of-thought специальным этапом тренировки с помощью reinforcement learning. Предполагается, что reasoning модель способна раскладывать задачу на подзадачи, и чем дольше она "думает" над задачей, тем лучше ответ. Это, конечно, не всегда так. Существует множество работ, указывающих на то, что процесс рассуждений модели может и не иметь прямого отношения к выводам. Но в некоторых задачах reasoning модели приносят ощутимый результат и даже вне своей весовой категории. Например, я сам видел как в одной продакшн-задаче маленькая модель с ризонингом от большой компании G победила фронтир модель без reasoning от большой компании A с отрывом в 0.2 F1-Score.
Много релизов за неделю: о3 и Gemini Flash 2.5. Но и для GPU poor что-то подвезли!
Meta FAIR выпустили опенсорс модели, в том числе визуальный энкодер лучше Siglip2, VLM и даже Byte Latent Transformer!
Модели на 1b, 3b и 8b.
https://ai.meta.com/blog/meta-fair-updates-perception-localization-reasoning
Meta FAIR выпустили опенсорс модели, в том числе визуальный энкодер лучше Siglip2, VLM и даже Byte Latent Transformer!
Модели на 1b, 3b и 8b.
https://ai.meta.com/blog/meta-fair-updates-perception-localization-reasoning
Meta AI
Advancing AI systems through progress in perception, localization, and reasoning
Meta FAIR is releasing several new research artifacts that advance our understanding of perception and support our goal of achieving advanced machine intelligence (AMI).