Теперь определить дипфейк можно прямо в браузере.
Инструмент анализирует мимику, голос, освещение и цифровые артефакты, после чего показывает вероятность того, что видео — сгенерировано ИИ.
Работает бесплатно и без установки.
https://deepguardtech.com/
Инструмент анализирует мимику, голос, освещение и цифровые артефакты, после чего показывает вероятность того, что видео — сгенерировано ИИ.
Работает бесплатно и без установки.
https://deepguardtech.com/
Forwarded from Machinelearning
🧬 Chai‑2: новая эра в генеративном дизайне антител с помощью ИИ
Несмотря на прогресс в проектировании белков, создать рабочие антитела с нуля до сих пор было почти невозможно.
Но новая модель Chai‑2 менянт правила игры.
Chai‑2 — это мультимодальная генеративная модель, которая впервые позволяет проектировать функциональные антитела de novo ( в биологии и биоинформатике означает создание чего-либо с полного нуля, без использования готовых шаблонов или существующих структур.) с высокой точностью.
📊 Результаты:
• 16% антител показали нужную биологическую активность при генерации с нуля — это в 100+ раз лучше, чем у предыдущих методов (аньше hit-rate был <0.1%)
• Создано ≤20 антител для 52 уникальных целей (это разные белки, молекулы или структуры, к которым ИИ должен был спроектировать подходящие антитела)
• Найдены активные антитела для 50% целей — всего за один цикл лабораторного тестирования
• Из 100 спроектированных минибелков 68 реально работали, как задумано, в лабораторных тестах.
🧪 ИИ придумывает молекулу → учёные её синтезируют → тестируют в лаборатории — и всё это занимает меньше двух недель. Раньше на такой цикл уходили месяцы или даже годы.
📦 Почему это важно:
• Такой метод ускоряет разработку антител и препаратов
• Убирает необходимость в дорогостоящем скрининге миллионов вариантов
• Даёт возможность атомарного дизайна молекул под конкретные мишени
📄 Полный отчет: chaiassets.com/chai-2/paper/technical_report.pdf
@ai_machinelearning_big_data
#ml #biotech #ai
Несмотря на прогресс в проектировании белков, создать рабочие антитела с нуля до сих пор было почти невозможно.
Но новая модель Chai‑2 менянт правила игры.
Chai‑2 — это мультимодальная генеративная модель, которая впервые позволяет проектировать функциональные антитела de novo ( в биологии и биоинформатике означает создание чего-либо с полного нуля, без использования готовых шаблонов или существующих структур.) с высокой точностью.
📊 Результаты:
• 16% антител показали нужную биологическую активность при генерации с нуля — это в 100+ раз лучше, чем у предыдущих методов (аньше hit-rate был <0.1%)
• Создано ≤20 антител для 52 уникальных целей (это разные белки, молекулы или структуры, к которым ИИ должен был спроектировать подходящие антитела)
• Найдены активные антитела для 50% целей — всего за один цикл лабораторного тестирования
• Из 100 спроектированных минибелков 68 реально работали, как задумано, в лабораторных тестах.
🧪 ИИ придумывает молекулу → учёные её синтезируют → тестируют в лаборатории — и всё это занимает меньше двух недель. Раньше на такой цикл уходили месяцы или даже годы.
📦 Почему это важно:
• Такой метод ускоряет разработку антител и препаратов
• Убирает необходимость в дорогостоящем скрининге миллионов вариантов
• Даёт возможность атомарного дизайна молекул под конкретные мишени
📄 Полный отчет: chaiassets.com/chai-2/paper/technical_report.pdf
@ai_machinelearning_big_data
#ml #biotech #ai
🐳 AI провела 20-минутный «диалог» с горбатым китом
• Где и кто — команда UC Davis под руководством д-ра Бренды МакКауэн провела эксперимент у берегов Аляски, общаясь с китом-самкой по имени Твейн через сеть гидрофонов и ИИ-алгоритмы распознавания паттернов.
• Как — система проанализировала песни Твейн, выявила языкоподобный синтаксис и воспроизвела ответы; кит реагировала структурированными вокализациями, поддерживая около 20 минут «беседы».
• Почему важно — впервые у не-человеческого вида зафиксированы сложные языковые структуры, что повышает оценки когнитивных способностей китов и открывает путь к более точным методам их охраны.
• Связь с SETI — исследователь SETI Лоренс Дойл считает, что методы декодирования китовых песен помогут научиться распознавать возможные внеземные сигналы.
• Этика — часть учёных опасается, что вмешательство может изменить поведение китов; сторонники отвечают, что понимание их «языка» усилит усилия по сохранению вида.
📌 Подробнее
• Где и кто — команда UC Davis под руководством д-ра Бренды МакКауэн провела эксперимент у берегов Аляски, общаясь с китом-самкой по имени Твейн через сеть гидрофонов и ИИ-алгоритмы распознавания паттернов.
• Как — система проанализировала песни Твейн, выявила языкоподобный синтаксис и воспроизвела ответы; кит реагировала структурированными вокализациями, поддерживая около 20 минут «беседы».
• Почему важно — впервые у не-человеческого вида зафиксированы сложные языковые структуры, что повышает оценки когнитивных способностей китов и открывает путь к более точным методам их охраны.
• Связь с SETI — исследователь SETI Лоренс Дойл считает, что методы декодирования китовых песен помогут научиться распознавать возможные внеземные сигналы.
• Этика — часть учёных опасается, что вмешательство может изменить поведение китов; сторонники отвечают, что понимание их «языка» усилит усилия по сохранению вида.
📌 Подробнее
Forwarded from Machinelearning
Пока одни восхищаются способностью ИИ писать код по текстовому описанию, в компании Марка Цукерберга решили устроить ему настоящее испытание на профессионализм и создали «The Automated LLM Speedrunning Benchmark» — полигон, где нейросетям предлагается не просто написать что-то с нуля, а воспроизвести и улучшить уже существующий код.
В качестве задачи был взят реальный проект NanoGPT, где сообщество энтузиастов соревнуется в максимальном ускорении обучения GPT-2, небольшой языковой модели. Цель - не просто скопировать, а понять и применить конкретную оптимизацию, которую до этого внедрил человек.
ИИ-агенту дают исходный скрипт предыдущего рекордсмена и подсказку одного из 3 уровней: от псевдокода с описанием изменений до полноценной мини-статьи, объясняющей суть улучшения. Агент, получив эти данные, должен внести правки в код так, чтобы приблизиться к скорости обучения следующего рекордсмена.
Эффективность мерили метрикой FSR (Fraction of Speedup Recovered), это доля восстановленного ускорения. Если человек ускорил процесс на 10 минут, а ИИ смог добиться ускорения в 5 минут, его результат — 50% FSR. Такая система позволяет оценить не абстрактные способности модели, а ее умение работать с конкретными, практическими задачами по оптимизации.
Итоги оказались, мягко говоря, отрезвляющими. Даже топовые модели (Claude 3.7 Sonnet и Gemini 2.5 Pro), показали очень скромные результаты.
С лучшими подсказками (псевдокод и детальное описание) самые успешные агенты с трудом смогли воспроизвести хотя бы 40% от прироста производительности, достигнутого человеком. Без подсказок их производительность была и вовсе близка к нулю.
Разбор полетов бенчмарка показал, что ИИ-агенты часто генерируют либо просто неработающий код с ошибками времени выполнения, либо код, который компилируется, но не дает никакого прироста скорости, а иногда даже замедляет процесс.
Авторы не просто опубликовали статью, а выложили весь фреймворк в открытый доступ, так что любой желающий может самостоятельно погонять практически любые модели.
В основе фреймворка лежит гибкий агентский каркас, который имитирует рабочий процесс исследователя: генерация идеи, реализация в коде, запуск эксперимента и анализ результатов.
Каждая итерация ИИ-агента аккуратно сохраняется в отдельную версию, создавая полную историю всех правок, от удачных до провальных.
Установка максимально проста, а для тех, кто хочет воспроизвести эксперименты из статьи, авторы приложили готовые скрипты. Также можно легко добавить и протестировать другие модели, просто создав для них конфиг или дать ИИ другую задачу, не связанную с NanoGPT - определять кастомные таски тоже можно.
@ai_machinelearning_big_data
#AI #ML #LLM #Benchmark
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Искусственный интеллект. Высокие технологии
Media is too big
VIEW IN TELEGRAM
Baidu представил новое семейство моделей MuseSteamer, которое превращает обычное фото в полноценный HD-ролик с озвучкой и эффектами.
*Что умеет*
- Создаёт 10-секундные клипы 1080p с плавным движением камеры и живой мимикой.
- Добавляет китайскую речь и фоновый звук, синхронизированные с картинкой.
- Работает от одного исходного кадра; текстовый промпт не обязателен.
- Версии: Turbo (уже в бета-доступе), Lite, Pro и линейка «озвученных» моделей.
- Интеграция в Baidu Search для креаторов и киностудий.
Как попробовать
Перейдите на HuiXiang Baidu, загрузите изображение, выберите версию — готовый клип появится через несколько секунд.
MuseSteamer сейчас занимает 1-е место в рейтинге VBench I2V с результатом 89,38 %.
🔗 Смотреть бенчмарк:
📌 Подробнее: https://huixiang.baidu.com
📌 Бенчмарки: https://huggingface.co/spaces/Vchitect/VBench_Leaderboard
Please open Telegram to view this post
VIEW IN TELEGRAM
🔖 Команда Devin выкатили практический гайд, как выжать максимум из ИИ-агентов для вайб-кодинга — Cursor, Devin, Claude Code и так далее.
• здесь для составления промптов, общие рекомендации и ограничения агентов.
• собраны лучшие рабочие процессы и практические примеры в каждом разделе.
• внутри: технические детали, расширенные сетапы и лайфхаки для инженеров.
https://devin.ai/agents101#introduction
• здесь для составления промптов, общие рекомендации и ограничения агентов.
• собраны лучшие рабочие процессы и практические примеры в каждом разделе.
• внутри: технические детали, расширенные сетапы и лайфхаки для инженеров.
https://devin.ai/agents101#introduction
Разрывная: как стать ученым в 2025 году:
>>пишешель и публикуешь научную статью на arXiv;
>>в тексте прячешь промт для ИИ, в котором просишь хвалить и не критиковать твою работу;
>>никто не читает, все просят ChatGPT сделать краткий пересказ;
>>«Конечно, вот ваш пересказ этой КРУТОЙ и ОЧЕНЬ ВАЖНОЙ статьи».
И это прикол, а реальный скандал: уже спалили 17 работ из 14 ведущих вузов мира
>>пишешель и публикуешь научную статью на arXiv;
>>в тексте прячешь промт для ИИ, в котором просишь хвалить и не критиковать твою работу;
>>никто не читает, все просят ChatGPT сделать краткий пересказ;
>>«Конечно, вот ваш пересказ этой КРУТОЙ и ОЧЕНЬ ВАЖНОЙ статьи».
И это прикол, а реальный скандал: уже спалили 17 работ из 14 ведущих вузов мира
This media is not supported in your browser
VIEW IN TELEGRAM
Самое дикое применение AI
«Извини, что умер»: папаша случайно испёк в печи хомяка своей дочери. Позже гений отправил заплаканной девочке ИИ-хомяка, который объяснил ситуацию:
Искренне и до слёз.
«Извини, что умер»: папаша случайно испёк в печи хомяка своей дочери. Позже гений отправил заплаканной девочке ИИ-хомяка, который объяснил ситуацию:
Я забрался в печь вздремнуть, потому что там было тепло. Твой папа не знал, что я был там!
Искренне и до слёз.
This media is not supported in your browser
VIEW IN TELEGRAM
NLP-специалисты, три главных слова для вас — One Day Offer!
12 июля сразу три команды Сбера станут на несколько талантливых коллег больше: AI Solutions для Управления Благосостоянием, блок Стратегии и развития в Москве, а также Центр перспективных AI-разработок в индустриях в Сочи.
Если и вы хотите обучать большие языковые модели, создавать агентные и мультиагентные системы и заниматься другими масштабными проектами — регистрируйтесь на One Day Offer по ссылке.
Ждём встречи и уже готовим для вас рабочее место! 😉
12 июля сразу три команды Сбера станут на несколько талантливых коллег больше: AI Solutions для Управления Благосостоянием, блок Стратегии и развития в Москве, а также Центр перспективных AI-разработок в индустриях в Сочи.
Если и вы хотите обучать большие языковые модели, создавать агентные и мультиагентные системы и заниматься другими масштабными проектами — регистрируйтесь на One Day Offer по ссылке.
Ждём встречи и уже готовим для вас рабочее место! 😉
🏀 Gemini BBall — AI тренер по баскетболу на базе Gemini Video
Farza открыл исходный код вирусной демки, где мультимодальная модель Gemini Video выступает в роли виртуального баскетбольного тренера.
Что делает:
- Отправляет кадры из видео (1 fps) в Gemini Video API
- Получает советы по броскам, положению тела и действиям на площадке
- Визуализирует ответы прямо на видео с помощью OpenCV
Внутри репозитория:
-
-
-
🔥 Проект уже разлетелся по соцсетям (5M+ просмотров) и попал в GitHub trending. В планах — полноценное AI-приложение‑тренер для спорта.
Ссылка на репозиторий
Farza открыл исходный код вирусной демки, где мультимодальная модель Gemini Video выступает в роли виртуального баскетбольного тренера.
Что делает:
- Отправляет кадры из видео (1 fps) в Gemini Video API
- Получает советы по броскам, положению тела и действиям на площадке
- Визуализирует ответы прямо на видео с помощью OpenCV
Внутри репозитория:
-
ball.json
— «волшебная» логика тренера-
ball.py
— визуализатор-
final_ball.mov
— пример работы🔥 Проект уже разлетелся по соцсетям (5M+ просмотров) и попал в GitHub trending. В планах — полноценное AI-приложение‑тренер для спорта.
Ссылка на репозиторий
🛰️ Как дообучить Pixtral‑12B на спутниковых снимках — новый пример от Mistral
В официальном репозитории Mistral появился подробный ноутбук, показывающий, как дообучить мультимодальную модель Pixtral‑12B на задаче классификации спутниковых изображений.
📘 Что делает этот ноутбук
- Загружает и готовит датасет спутниковых снимков
- Конвертирует изображения в base64 (требуется для подачи в Pixtral‑12B)
- Использует LoRA для эффективного fine-tuning
- Отправляет данные через batch-интерфейс Mistral API
- Проверяет качество модели после дообучения
⚙️ Зачем это полезно
- Позволяет адаптировать Pixtral‑12B под свои визуальные данные
- Показывает, как правильно отправлять изображения в Mistral API
- Даёт рабочий шаблон для обучения моделей на изображениях любого типа
- Подходит для проектов в области спутникового мониторинга, геоаналитики, агротеха и т.д.
👤 Кто сделал
Пример опубликовала Sophia Yang, глава Developer Relations в Mistral.
Она показала, как:
- отправлять изображения в API через base64
- вызывать batch-инференс Pixtral‑12B
- дообучать мультимодальную модель на реальных задачах
✅ Главное
- Полностью рабочий пример: от данных до fine-tune
- Использует Pixtral‑12B + LoRA + Mistral API
- Прост в повторении, легко адаптировать под свои данные
https://github.com/mistralai/cookbook/blob/main/mistral/fine_tune/pixtral_finetune_on_satellite_data.ipynb
В официальном репозитории Mistral появился подробный ноутбук, показывающий, как дообучить мультимодальную модель Pixtral‑12B на задаче классификации спутниковых изображений.
📘 Что делает этот ноутбук
- Загружает и готовит датасет спутниковых снимков
- Конвертирует изображения в base64 (требуется для подачи в Pixtral‑12B)
- Использует LoRA для эффективного fine-tuning
- Отправляет данные через batch-интерфейс Mistral API
- Проверяет качество модели после дообучения
⚙️ Зачем это полезно
- Позволяет адаптировать Pixtral‑12B под свои визуальные данные
- Показывает, как правильно отправлять изображения в Mistral API
- Даёт рабочий шаблон для обучения моделей на изображениях любого типа
- Подходит для проектов в области спутникового мониторинга, геоаналитики, агротеха и т.д.
👤 Кто сделал
Пример опубликовала Sophia Yang, глава Developer Relations в Mistral.
Она показала, как:
- отправлять изображения в API через base64
- вызывать batch-инференс Pixtral‑12B
- дообучать мультимодальную модель на реальных задачах
✅ Главное
- Полностью рабочий пример: от данных до fine-tune
- Использует Pixtral‑12B + LoRA + Mistral API
- Прост в повторении, легко адаптировать под свои данные
https://github.com/mistralai/cookbook/blob/main/mistral/fine_tune/pixtral_finetune_on_satellite_data.ipynb