Telegram Web Link
https://mistral.ai/news/mistral-small-3-1

Внезапно мистраль выложил 24B мультимодальную модель Mistral Small 3.1, которая бьет GPT-4o Mini, Claude-3.5 Haiku и недавно вышедшие Gemma 3 (27B) и Cohere Aya Vision (32B).

Конечно подождем результатов на арене, но если подтвердиться, то считайте можно запускать бесплатную и улучшенную GPT-4o Mini на своём макбуке
😎😎😎😎😎

Я конечно согласился, ждите
Please open Telegram to view this post
VIEW IN TELEGRAM
💅 Уход за кожей в машинном обучении

О, ты МОП, закончил ШАД, написал три статьи по Байесовскому DL? Поздравляю вставай в эту очередь опоздавших на пять лет.

Этим сейчас никого не удивишь, но многие упускают необходимую базу для работы с нейросетями: гладкую кожу. Поэтому это дешевое преимущество если вы готовы инвестировать усилия в свою карьеру.

Когда вы сидите на фит интервью с бимбо-эйчаркой она должна видеть, что ваша кожа сияет. Причем больше, чем у неё самой. Тогда она чувствует, что перед ней доминантная особь, и пропускает вас дальше. Так же и на следующих этапах. Литкод больше не работает, поэтому отсев идет только по мягкости кожи.

Чтобы ваша кожа была гладкой как лосс функция MSE, делюсь гайдом.

1. Очищение: Гидрофильное масло → pH-сбалансированный пенящийся очиститель (5.5-6.0) → мицеллярная вода для остатков.
2. Тонизация: Безспиртовой тоник с ниацинамидом (3-5%), глицерином, гиалуроновой кислотой, нанесение методом "7 skin".
3. Активы: Утро - антиоксиданты (L-аскорбиновая кислота 15-20%), вечер - ретиноиды/AHA/BHA (чередовать).
4. Ретинол: Начать с 0.01-0.03%, постепенно повышая до 0.25-1.0%. Буферизировать сэндвич-методом. Внедрять по схеме 1-2-3 (1 раз в неделю, затем 2, затем 3). Обязательная фаза ретинизации 4-12 недель. Альтернативы: ретинальдегид (в 11 раз сильнее), HPR (менее раздражающий), бакучиол (фитоальтернатива).
5. Увлажнение: Многослойное нанесение - пептиды, керамиды, сквалан, пантенол.
6. Защита: SPF 50+ PA++++ с фильтрами нового поколения, ребазировать каждые 2 часа.
7. Еженедельно: Энзимный пилинг, неабразивная эксфолиация, окклюзионная маска для трансэпидермальной регидратации.
8. Коррекция по фототипу Фитцпатрика и барьерной функции.

Это МИНИМУМ для работы с нейросетями в 2025
This media is not supported in your browser
VIEW IN TELEGRAM
https://huggingface.co/manycore-research/SpatialLM-Llama-1B

https://manycore-research.github.io/SpatialLM/

Я стараюсь не приносить сюда посты вида "вышла очередная модель". Но тут 1B LLAMA для облаков точек, выглядит просто убойно, не могу не поделиться. Посмотрите сайт, там другие примеры очень интересные.

Украл у @lovedeathtransformers
Forwarded from AbstractDL
M-Attack: как обмануть GPT-4.5 и Gemini

Все привыкли, что атаковать современные мультимодальные модели (типа GPT-4o, Claude, Gemini и т.п.) крайне сложно — особенно, если это black-box модели, где нет доступа к градиентам и архитектуре. Стандартные подходы атак типа "выдать одну картинку за другую" часто генерируют какие-то невнятные шумы, которые либо игнорируются моделью, либо приводят к абстрактным ответам типа "размытое изображение".

Но оказалось, что проблема была не в самих моделях, а в подходе к генерации возмущений. В свежей статье предложили очень простой, но мощный подход — M-Attack:
1. Берём исходную и целевую картинки.
2. На каждом шаге рандомно crop'аем кусок исходного изображения (50-100% площади) и затем ресайзим обратно до исходного размера.
3. Заставляем эмбеддинги этого кусочка максимально приблизиться к эмбеддингам целевого изображения оптимизируясь в white-box режиме по ансамблю открытых визуальных моделей (например, CLIP, ViT и тп).

И всё! После нескольких итераций в центральной области картинки "проявляется" целевая семантика, при этом возмущения выглядят крайне незаметно и аккуратно (в отличие от других подходов).

Авторы добились совершенно впечатляющих результатов: успех атаки (ASR) превышает 90% (!) для GPT-4.5, GPT-4o и даже для o1 и Gemini. Код и датасет из 100 атакованных картинок выложили в открытый доступ.

Статья, GitHub, dataset
Forwarded from КПД
Scale-wise Distillation of Diffusion Models
[Статья] [Демка] [Код soon]

Введение

Диффузионные модели на протяжении последних несколько лет удерживают пальму первенства среди семейств генеративных моделей во многих приложениях. Однако их фундаментальным ограничением является многошаговое сэмплирование, из-за чего генерация занимает много времени.

Научное сообщество предложило вагон и маленькую тележку различных процедур дистилляции многошаговых моделей в малошаговые. Но при приближении количества шагов к 1-му качество неизбежно просаживается даже для самых продвинутых подходов.

Отсюда мысль 🤔 - а что если ускорить генерацию за счет удешевления шагов сэмплирования?

Мы с коллегами из Yandex Research предложили метод дистилляции в несколько-шаговую генерацию, где разрешение изображения увеличивается постепенно, на каждом шаге генерации (SwD). За счет этого удается достичь более чем 2х кратного ускорения по сравнению с эквивалентной дистилляцией в фиксированном разрешении.
Please open Telegram to view this post
VIEW IN TELEGRAM
# Ты и твой личный мультиверс

Ты вполне можешь быть мозгом плавающим в банке. В том смысле, что на плавающий в банке мозг можно в теории воздействовать таким образом, что его субъективное восприятие будет неотличимо от твоего текущего восприятия. Включая все воспоминания. Мозгу в банке тоже будет казаться, например, что он и не в банке вовсе, а полноценный Борис, только что налил себе кофе, сел на диван, пишет телеграм пост.

В общем ты, читающий этот пост, это один момент субъективного восприятия. В этот момент была проиграна нарезка образов которая создала контекст, ощущение переемственности и иллюзию движения во времени. Благодаря этому ты уже не просто вспышка воприятия, а продолжение прошлого тебя который был пять милисекунд назад. И ты чувствуешь, что несешь ответственность за то, какой бардак достанется следующей версии пять милисекунд спустя.

Мозг в банке воображающий себя тобой может испытывать вину за прошлые ошибки. При вгляде со стороны это очень нелепо. Потому что и прошлого не было, и ошибок никто не совершал, и этот мозг к ним не имеет никакого отношения, всё это пропадет в следующее мгновение и ничего нельзя изменить.

Прикол в том, что ты и есть мозг в банке. Если рассматривать себя как череду мгновений, то каждого прошлого и будущего себя можно воспринимать как отдельную личность. Они все равноправные, так как упорядочивание на прошлых и будущих находится в глазах того, кто делает упорядочивание. Бесконечное количество вариаций тебя проживающее бесконечное множество моментов.

Благодаря сознанию мы имеем возможность некой коммуникации друг с другом. Мы можем, например, положить вечером носочки на батарею, чтобы следующему себе было приятно, хотя лично мы не увидим результатов этого труда.

Возникает вопрос как нам вместе жить в этом мультиверс-коллективе. Я как невротик склонен себя за всё винить, то есть чувствую ответственность за действия прошлого себя и ставлю требования к будущему себе. В итоге получается одни вариации меня постоянно ругают вторые (прошлые) и чего-то требуют от третьих (будущих). Мультиверс который без остановки между собой грызется. Как же достал этот Boris_{t-1}!

Однако если воспринимать всех меня как отдельных личностей, то винить кого-то уже не получается. Винить себя текущего не за что: я только что вылупился и работаю с тем, что досталось. Винить прошлых себя то же не за что, ведь они в аналогичной ситуации. Если они такие как я, значит тоже искренне делали, что могли. Все в одной лодке, всем можно только сострадать и сочувствовать.

Единственный разумный выход это помогать друг другу. Нельзя изменить ситуацию, так что надо приспосабливаться. Если предположить, что другие версии тебя как и ты им желают тебе счастья, то ругаться бесполезно. Можно начать вместе поднимать ватерлинию счастья по мультиверсу.
Forwarded from partially unsupervised
Старый приятель @peopleintech показал the best scam ever: приложение с гороскопами и прочей эзотерической мутью, а под капотом на самом деле - AI и когнитивно-поведенческая терапия. Надеюсь, в качестве дефолтной LLM там Gemini

Вообще, на первый взгляд это смешно, а если задуматься, то такой UX не может не быть успешнее, чем стандартный чат-интерфейс с дополнительной парой кнопок поверх LLM API 🤔
Forwarded from БАШНЯ
СОЗВОН-ПОДКАСТ❗️

Новый онлайн-подкаст состоится уже 3 апреля (четверг) в 19:30 с очень крутым гостем: 🔥🔥🔥

Наш гость Борис Цейтлин, Staff ML Engineer в eBay, преподаватель ML (OTUS, DLS).🤙

Тема подкаста: «ML, Data Science и поиск работы: как не потеряться в море информации?» 🙈

О чем поговорим?
🟣Как эффективно учить ML и искать работу?
🟣Ошибки новичков в карьере и способы их избежать.
🟣Как попасть в международную компанию и развиваться дальше?👨‍💻

🔥 Не пропусти! Будет очень интересно и полезно. И не забудь позвать друзей и коллег)💖💖💖
Please open Telegram to view this post
VIEW IN TELEGRAM
Вайкодинг это хорошо, но как насчёт вайб-геополитики?
Начинаем эфир в канале Башни вот прямо сейчас уже почти
Forwarded from БАШНЯ
СОЗВОН-ПОДКАСТ❗️

Напоминаю, что уже сегодня в 19:30 будет онлайн-подкаст с очень крутым гостем: 🔥

Гость — Борис Цейтлин, Staff ML Engineer в eBay, преподаватель ML (OTUS, DLS).

Так же пишет крутые статьи, методички и книги 🤯, о которых мы тоже поговорим!

Тема подкаста: «ML, Data Science и поиск работы: как не потеряться в море информации?» 🙈

🔥 Не пропусти! Подключайся сам и зови свои друзей 💖

#events
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/07/06 23:35:03
Back to Top
HTML Embed Code: