Telegram Web Link
Теперь определить дипфейк можно прямо в браузере.

Инструмент анализирует мимику, голос, освещение и цифровые артефакты, после чего показывает вероятность того, что видео — сгенерировано ИИ.

Работает бесплатно и без установки.

https://deepguardtech.com/
Forwarded from Machinelearning
🧬 Chai‑2: новая эра в генеративном дизайне антител с помощью ИИ

Несмотря на прогресс в проектировании белков, создать рабочие антитела с нуля до сих пор было почти невозможно.

Но новая модель Chai‑2 менянт правила игры.

Chai‑2 — это мультимодальная генеративная модель, которая впервые позволяет проектировать функциональные антитела de novo ( в биологии и биоинформатике означает создание чего-либо с полного нуля, без использования готовых шаблонов или существующих структур.) с высокой точностью.

📊 Результаты:
• 16% антител показали нужную биологическую активность при генерации с нуля — это в 100+ раз лучше, чем у предыдущих методов (аньше hit-rate был <0.1%)
• Создано ≤20 антител для 52 уникальных целей (это разные белки, молекулы или структуры, к которым ИИ должен был спроектировать подходящие антитела)
• Найдены активные антитела для 50% целей — всего за один цикл лабораторного тестирования
• Из 100 спроектированных минибелков 68 реально работали, как задумано, в лабораторных тестах.

🧪 ИИ придумывает молекулу → учёные её синтезируют → тестируют в лаборатории — и всё это занимает меньше двух недель. Раньше на такой цикл уходили месяцы или даже годы.

📦 Почему это важно:
• Такой метод ускоряет разработку антител и препаратов
• Убирает необходимость в дорогостоящем скрининге миллионов вариантов
• Даёт возможность атомарного дизайна молекул под конкретные мишени

📄 Полный отчет: chaiassets.com/chai-2/paper/technical_report.pdf

@ai_machinelearning_big_data


#ml #biotech #ai
🐳 AI провела 20-минутный «диалог» с горбатым китом

Где и кто — команда UC Davis под руководством д-ра Бренды МакКауэн провела эксперимент у берегов Аляски, общаясь с китом-самкой по имени Твейн через сеть гидрофонов и ИИ-алгоритмы распознавания паттернов.

Как — система проанализировала песни Твейн, выявила языкоподобный синтаксис и воспроизвела ответы; кит реагировала структурированными вокализациями, поддерживая около 20 минут «беседы».

Почему важно — впервые у не-человеческого вида зафиксированы сложные языковые структуры, что повышает оценки когнитивных способностей китов и открывает путь к более точным методам их охраны.

Связь с SETI — исследователь SETI Лоренс Дойл считает, что методы декодирования китовых песен помогут научиться распознавать возможные внеземные сигналы.

Этика — часть учёных опасается, что вмешательство может изменить поведение китов; сторонники отвечают, что понимание их «языка» усилит усилия по сохранению вида.

📌 Подробнее
Forwarded from Machinelearning
🌟 LLM Speedrunning Benchmark: ИИ-ассистенты пока не способны улучшить код, написанный человеком.

Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.

В качестве задачи был взят реальный проект NanoGPT, где сообщество энтузиастов соревнуется в максимальном ускорении обучения GPT-2, небольшой языковой модели. Цель - не просто скопировать, а понять и применить конкретную оптимизацию, которую до этого внедрил человек.

🟡Суть эксперимента

ИИ-агенту дают исходный скрипт предыдущего рекордсмена и подсказку одного из 3 уровней: от псевдокода с описанием изменений до полноценной мини-статьи, объясняющей суть улучшения. Агент, получив эти данные, должен внести правки в код так, чтобы приблизиться к скорости обучения следующего рекордсмена.

Эффективность мерили метрикой FSR (Fraction of Speedup Recovered), это доля восстановленного ускорения. Если человек ускорил процесс на 10 минут, а ИИ смог добиться ускорения в 5 минут, его результат — 50% FSR. Такая система позволяет оценить не абстрактные способности модели, а ее умение работать с конкретными, практическими задачами по оптимизации.

🟡Результаты

Итоги оказались, мягко говоря, отрезвляющими. Даже топовые модели (Claude 3.7 Sonnet и Gemini 2.5 Pro), показали очень скромные результаты.

С лучшими подсказками (псевдокод и детальное описание) самые успешные агенты с трудом смогли воспроизвести хотя бы 40% от прироста производительности, достигнутого человеком. Без подсказок их производительность была и вовсе близка к нулю.

Разбор полетов бенчмарка показал, что ИИ-агенты часто генерируют либо просто неработающий код с ошибками времени выполнения, либо код, который компилируется, но не дает никакого прироста скорости, а иногда даже замедляет процесс.

🟡Фреймворк

Авторы не просто опубликовали статью, а выложили весь фреймворк в открытый доступ, так что любой желающий может самостоятельно погонять практически любые модели.

В основе фреймворка лежит гибкий агентский каркас, который имитирует рабочий процесс исследователя: генерация идеи, реализация в коде, запуск эксперимента и анализ результатов.

Каждая итерация ИИ-агента аккуратно сохраняется в отдельную версию, создавая полную историю всех правок, от удачных до провальных.

Установка максимально проста, а для тех, кто хочет воспроизвести эксперименты из статьи, авторы приложили готовые скрипты. Также можно легко добавить и протестировать другие модели, просто создав для них конфиг или дать ИИ другую задачу, не связанную с NanoGPT - определять кастомные таски тоже можно.


📌Лицензирование: MIT License.


🟡Arxiv
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM #Benchmark
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
🖥 MuseSteamer — генератор видео по картинке

Baidu представил новое семейство моделей MuseSteamer, которое превращает обычное фото в полноценный HD-ролик с озвучкой и эффектами.

*Что умеет*
- Создаёт 10-секундные клипы 1080p с плавным движением камеры и живой мимикой.
- Добавляет китайскую речь и фоновый звук, синхронизированные с картинкой.
- Работает от одного исходного кадра; текстовый промпт не обязателен.
- Версии: Turbo (уже в бета-доступе), Lite, Pro и линейка «озвученных» моделей.
- Интеграция в Baidu Search для креаторов и киностудий.

Как попробовать
Перейдите на HuiXiang Baidu, загрузите изображение, выберите версию — готовый клип появится через несколько секунд.

MuseSteamer сейчас занимает 1-е место в рейтинге VBench I2V с результатом 89,38 %.

🔗 Смотреть бенчмарк:

📌 Подробнее: https://huixiang.baidu.com
📌 Бенчмарки: https://huggingface.co/spaces/Vchitect/VBench_Leaderboard
Please open Telegram to view this post
VIEW IN TELEGRAM
🔖 Команда Devin выкатили практический гайд, как выжать максимум из ИИ-агентов для вайб-кодинга — Cursor, Devin, Claude Code и так далее.

• здесь для составления промптов, общие рекомендации и ограничения агентов.
• собраны лучшие рабочие процессы и практические примеры в каждом разделе.
• внутри: технические детали, расширенные сетапы и лайфхаки для инженеров.

https://devin.ai/agents101#introduction
Разрывная: как стать ученым в 2025 году:

>>пишешель и публикуешь научную статью на arXiv;
>>в тексте прячешь промт для ИИ, в котором просишь хвалить и не критиковать твою работу;
>>никто не читает, все просят ChatGPT сделать краткий пересказ;
>>«Конечно, вот ваш пересказ этой КРУТОЙ и ОЧЕНЬ ВАЖНОЙ статьи».

И это прикол, а реальный скандал: уже спалили 17 работ из 14 ведущих вузов мира
This media is not supported in your browser
VIEW IN TELEGRAM
Самое дикое применение AI

«Извини, что умер»: папаша случайно испёк в печи хомяка своей дочери. Позже гений отправил заплаканной девочке ИИ-хомяка, который объяснил ситуацию:

Я забрался в печь вздремнуть, потому что там было тепло. Твой папа не знал, что я был там!


Искренне и до слёз.
This media is not supported in your browser
VIEW IN TELEGRAM
NLP-специалисты, три главных слова для вас — One Day Offer!

12 июля сразу три команды Сбера станут на несколько талантливых коллег больше: AI Solutions для Управления Благосостоянием, блок Стратегии и развития в Москве, а также Центр перспективных AI-разработок в индустриях в Сочи.

Если и вы хотите обучать большие языковые модели, создавать агентные и мультиагентные системы и заниматься другими масштабными проектами — регистрируйтесь на One Day Offer по ссылке.

Ждём встречи и уже готовим для вас рабочее место! 😉
🏀 Gemini BBall — AI тренер по баскетболу на базе Gemini Video

Farza открыл исходный код вирусной демки, где мультимодальная модель Gemini Video выступает в роли виртуального баскетбольного тренера.

Что делает:
- Отправляет кадры из видео (1 fps) в Gemini Video API
- Получает советы по броскам, положению тела и действиям на площадке
- Визуализирует ответы прямо на видео с помощью OpenCV

Внутри репозитория:
- ball.json — «волшебная» логика тренера
- ball.py — визуализатор
- final_ball.mov — пример работы

🔥 Проект уже разлетелся по соцсетям (5M+ просмотров) и попал в GitHub trending. В планах — полноценное AI-приложение‑тренер для спорта.

Ссылка на репозиторий
🛰️ Как дообучить Pixtral‑12B на спутниковых снимках — новый пример от Mistral

В официальном репозитории Mistral появился подробный ноутбук, показывающий, как дообучить мультимодальную модель Pixtral‑12B на задаче классификации спутниковых изображений.

📘 Что делает этот ноутбук

- Загружает и готовит датасет спутниковых снимков
- Конвертирует изображения в base64 (требуется для подачи в Pixtral‑12B)
- Использует LoRA для эффективного fine-tuning
- Отправляет данные через batch-интерфейс Mistral API
- Проверяет качество модели после дообучения

⚙️ Зачем это полезно

- Позволяет адаптировать Pixtral‑12B под свои визуальные данные
- Показывает, как правильно отправлять изображения в Mistral API
- Даёт рабочий шаблон для обучения моделей на изображениях любого типа
- Подходит для проектов в области спутникового мониторинга, геоаналитики, агротеха и т.д.

👤 Кто сделал

Пример опубликовала Sophia Yang, глава Developer Relations в Mistral.
Она показала, как:

- отправлять изображения в API через base64
- вызывать batch-инференс Pixtral‑12B
- дообучать мультимодальную модель на реальных задачах

Главное

- Полностью рабочий пример: от данных до fine-tune
- Использует Pixtral‑12B + LoRA + Mistral API
- Прост в повторении, легко адаптировать под свои данные

https://github.com/mistralai/cookbook/blob/main/mistral/fine_tune/pixtral_finetune_on_satellite_data.ipynb
2025/07/08 13:22:53
Back to Top
HTML Embed Code: