⚡️ Эндрю Нг, основатель DeepLearningAI и Coursera только что выпустил новый пакет Python с открытым исходным кодом.
Быстрая смена моделей через простой строковый идентификатор. Гибкая и простая в использовании и библиотека.
Одна строка для переключения между любыми LLM:
OpenAI ➝ "openai:gpt-4o"
Claude ➝ "антропный:claude-3-5-sonnet"
Лама ➝ "оллама:ллама3"
GitHub: https://github.com/andrewyng/aisuite
Быстрая смена моделей через простой строковый идентификатор. Гибкая и простая в использовании и библиотека.
Одна строка для переключения между любыми LLM:
OpenAI ➝ "openai:gpt-4o"
Claude ➝ "антропный:claude-3-5-sonnet"
Лама ➝ "оллама:ллама3"
pip install aisuite
GitHub: https://github.com/andrewyng/aisuite
🔥11👍4❤2👎2😁2🤬1
Как сэкономить до 44% на профессиональных GPU? 💰
Профессиональные GPU стоят дорого и покупать их не всегда выгодно. Например, если вам нужно протестировать сервис или выполнить краткосрочную задачу.
Оптимальное решение — арендовать видеокарту в облаке. Тем более сейчас в Selectel вы можете сделать это с большой выгодой. Скидка на аренду GPU NVIDIA A100 (40 ГБ) — 29%, а на NVIDIA A30 (24 ГБ) доходит до 44%.
Кроме скидки, при аренде GPU в облаке Selectel вы получаете:
🔹Отсутствие переплат и тарификацию только за используемые ресурсы
🔹Экономию на инфраструктуре благодаря прерываемым облачным серверам и возможности заморозки ресурсов
🔹Широкий выбор готовых конфигураций серверов под любые задачи и возможность индивидуальной настройки
Арендуйте GPU со скидкой до 44% в облаке Selectel: https://slc.tl/k7249
Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwNnQBh
Профессиональные GPU стоят дорого и покупать их не всегда выгодно. Например, если вам нужно протестировать сервис или выполнить краткосрочную задачу.
Оптимальное решение — арендовать видеокарту в облаке. Тем более сейчас в Selectel вы можете сделать это с большой выгодой. Скидка на аренду GPU NVIDIA A100 (40 ГБ) — 29%, а на NVIDIA A30 (24 ГБ) доходит до 44%.
Кроме скидки, при аренде GPU в облаке Selectel вы получаете:
🔹Отсутствие переплат и тарификацию только за используемые ресурсы
🔹Экономию на инфраструктуре благодаря прерываемым облачным серверам и возможности заморозки ресурсов
🔹Широкий выбор готовых конфигураций серверов под любые задачи и возможность индивидуальной настройки
Арендуйте GPU со скидкой до 44% в облаке Selectel: https://slc.tl/k7249
Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwNnQBh
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥2👍1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🔥1
📖 Читать: *клик*
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤4🔥4
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🥰3👍2🎉1
Forwarded from Machinelearning
SmolVLM - серия компактных VLM с 2 млрд. параметров, отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами.
Архитектура SmolVLM основана на Idefics3, с несколькими отличиями:
Модель кодирует каждый патч изображения 384x384 в 81 токен, что позволяет ей обрабатывать тестовые запросы и изображения с использованием всего 1.2 тыс. токенов, в то время как Qwen2-VL использует 16 тыс. токенов. Это преимущество приводит к значительно более высокой скорости предварительной обработки (в 3,3-4,5 раза) и генерации (в 7,5-16 раз) по сравнению с Qwen2-VL.
Для самостоятельной тонкой настройки SmolVLM можно использовать transformers и TRL. Разработчиками представлен блокнот для файнтюна на VQAv2 с использованием LoRA, QLoRA или полной тонкой настройки. SmolVLM интегрирован с TRL для DPO через CLI.
⚠️ При batch sizes=4 и 8-битной загрузке QLoRA файнтюн потребляет около ~16 GB VRAM
@ai_machinelearning_big_data
#AI #ML #SmallVLM #Huggingface
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1🔥1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5❤2🔥2😁2🥰1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍3🔥2
💡 Интересный тред том, как компании на самом деле внедряют LLM в продакшен (более 300 технических примеров, включая локальные
https://www.reddit.com/r/LocalLLaMA/comments/1h4u7au/a_nobs_database_of_how_companies_actually_deploy/
@machinelearning_ru
https://www.reddit.com/r/LocalLLaMA/comments/1h4u7au/a_nobs_database_of_how_companies_actually_deploy/
@machinelearning_ru
🔥9👍4❤2👎1🤬1
Forwarded from Machinelearning
В ноябре Джефф Хэнкок, основатель Лаборатории социальных сетей Стэнфорда и эксперт по технологиям и дезинформации, представил заявление по делу в суде Миннесоты, оспаривающему закон штата 2023 года, криминализирующий использование дипфейков для влияния на выборы. В 12-страничном документе профессора в защиту закона содержалось 15 ссылок, 2 из которых не удалось найти: «Дипфейки и иллюзия подлинности: когнитивные процессы, лежащие в основе восприятия дезинформации» и «Влияние дипфейковых видео на политические взгляды и поведение» – ни по указанному цифровому идентификатору объекта, ни в архивах указанных журналов. Адвокат истцов назвал ссылки "галлюцинацией искусственного интеллекта" и потребовал исключить заявление Хэнкока из материалов дела.
stanforddaily.com
Стартап World Labs, основанный профессором в области ИИ Фэй-Фэй Ли, представил свою первую разработку: систему ИИ, которая может создавать интерактивные 3D-сцены на основе одной фотографии. В отличие от многих других систем, преобразующих фото в 3D, сцены World Labs интерактивны и модифицируемы и позволяют «войти в любое изображение и исследовать его в 3D».
Система визуализирует сцены в режиме реального времени и поддерживает управление камерой и настройку глубины резкости. Она также позволяет применять к сценам интерактивные эффекты и анимацию, например, изменять цвет объектов и динамически освещать фон. World Labs планирует выпустить свой первый продукт в 2025 году и ориентируется на разработчиков видеоигр и киностудии.
techcrunch.com
Компания The Browser Company, разработчик браузера Arc, представила Dia - новый веб-браузер, основанный на искусственном интеллекте. Dia будет запущен в начале 2025 года и предложит пользователям ИИ-функции: "напиши следующую строку", "дай мне идею" и "резюмируй вкладку".
Dia понимает контекст всего окна браузера, может копировать ссылки из открытых вкладок и вставлять их в электронное письмо по команде пользователя. В промо-видеоролике разработчики показали, как Dia находит документ по описанию и отправляет его по электронной почте. Разработчики уверяют, что Arc продолжит свое существование, несмотря на запуск нового продукта.
theverge.com
Гибридная модель рекомендаций HRS-IU-DL сочетает в себе методы коллаборативной фильтрации, контентной фильтрации и нейроколлаборативной фильтрации. Модель использует RNN для выявления последовательных паттернов в поведении пользователей и TF-IDF для анализа атрибутов товаров.
HRS-IU-DL справляется с проблемами традиционных рекомендательных систем - разреженность данных и холодный старт, предоставляя точные и релевантные рекомендации. Для обучения и тестирования модели использовался датасет Movielens 100k. Результаты тестов показали, что HRS-IU-DL превосходит базовые модели по метрикам RMSE, MAE, точности и полноте.
nature.com
Закон ЕС об ИИ, вступивший в силу 2 декабря 2024 года, классифицирует системы ИИ по уровням риска: неприемлемый, высокий, ограниченный и минимальный.
В большинстве случаев разработчикам систем ИИ ограниченного риска (например, чат-ботов) потребуется обеспечить прозрачность взаимодействия с пользователем и маркировать контент, созданный ИИ. Разработчикам моделей ИИ общего назначения (GPAI) необходимо предоставить подробное описание данных, использованных для обучения модели, и соблюдать законы ЕС об авторском праве, включая механизмы отказа от использования защищенных авторским правом материалов.
Hugging Face предлагает инструменты, помогающие подготовиться к соблюдению требований: Model Cards, Dataset Cards, Gradio watermarking и поддержку механизмов отказа.
huggingface.co
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
⚽Universal Soccer Understanding⚽
👉Универсальное понимание футбольных видео : SoccerReplay-1988 - крупнейший мультимодальный датасетов.
✅ Статья https://arxiv.org/pdf/2412.01820
✅ Проект https://jyrao.github.io/UniSoccer/
✅ Репо https://github.com/jyrao/UniSoccer
@machinelearning_ru
👉Универсальное понимание футбольных видео : SoccerReplay-1988 - крупнейший мультимодальный датасетов.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2🔥2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🔦 IC-Light V2-Разные варианты
Модели IC-Light версии 2 для тех, кому нужны более яркие варианты освещения и модификации.
Демо: https://huggingface.co/spaces/lllyasviel/iclight-v2-vary
@machinelearning_ru
Модели IC-Light версии 2 для тех, кому нужны более яркие варианты освещения и модификации.
Демо: https://huggingface.co/spaces/lllyasviel/iclight-v2-vary
@machinelearning_ru
👍5🔥3❤2👎1
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2🔥2
🌤 Революционный инструмент в области прогнозирования погоды от Google!
Команда Google DeepMind презентовала GenCast – новую модель искусственного интеллекта, способную с высокой точностью предсказывать погоду на целых 15 дней вперёд! 🎯
GenCast – ансамблевая диффузионная модель для прогнозирования погоды и рисков экстремальных погодных условий, обеспечивающая более быстрые и точные прогнозы на срок до 15 дней. GenCast была обученная на 40-летнем архиве исторических метеорологических данных ERA5 от ECMWF.
Модель, работающая на Google Cloud TPU v5, превосходит лидирующую систему прогнозирования ECMWF ENS по точности прогнозов на 97,2% в 1320 различных комбинациях тестируемых параметров. GenCast демонстрирует способность прогнозировать экстремальные погодные явления: периоды сильной жары и холода, сильные ветры и траектории тропических циклонов. Google DeepMind планирует выпустить код, веса и прогнозы модели в открытый доступ, чтобы поддержать метеорологическое сообщество.
Почему это так важно?
- В условиях изменения климата погода становится всё менее предсказуемой.
- Точные прогнозы помогают спасти жизни и сохранить имущество.
- Это способствует эффективному планированию использования возобновляемых источников энергии.
Что может GenCast?
- Генерирует более 50 различных сценариев развития погоды и объединяет их в единый вероятностный прогноз.
- Обеспечивает разрешение до 0.25° для всего земного шара.
- Превышает точность лучших существующих систем прогнозирования в 97.2% случаев!
Как быстро он работает?
- Всего за 8 минут создаёт 15-дневный прогноз при помощи Google Cloud TPU v5. Для традиционных систем это занимает часы работы на суперкомпьютерах!
Особенно точен в прогнозах экстремальной погоды:
- Тайфунов и ураганов
- Аномально высоких и низких температур
- Сильнейших ветров
Открытый доступ:
Google DeepMind предоставляет исходный код модели и её весовые коэффициенты всем желающим, чтобы способствовать развитию метеорологии.
▪ Статья: https://deepmind.google/discover/blog/gencast-predicts-weather-and-the-risks-of-extreme-conditions-with-sota-accuracy/
▪ Github: https://github.com/google-deepmind/graphcast
@machinelearning_ru
Команда Google DeepMind презентовала GenCast – новую модель искусственного интеллекта, способную с высокой точностью предсказывать погоду на целых 15 дней вперёд! 🎯
GenCast – ансамблевая диффузионная модель для прогнозирования погоды и рисков экстремальных погодных условий, обеспечивающая более быстрые и точные прогнозы на срок до 15 дней. GenCast была обученная на 40-летнем архиве исторических метеорологических данных ERA5 от ECMWF.
Модель, работающая на Google Cloud TPU v5, превосходит лидирующую систему прогнозирования ECMWF ENS по точности прогнозов на 97,2% в 1320 различных комбинациях тестируемых параметров. GenCast демонстрирует способность прогнозировать экстремальные погодные явления: периоды сильной жары и холода, сильные ветры и траектории тропических циклонов. Google DeepMind планирует выпустить код, веса и прогнозы модели в открытый доступ, чтобы поддержать метеорологическое сообщество.
Почему это так важно?
- В условиях изменения климата погода становится всё менее предсказуемой.
- Точные прогнозы помогают спасти жизни и сохранить имущество.
- Это способствует эффективному планированию использования возобновляемых источников энергии.
Что может GenCast?
- Генерирует более 50 различных сценариев развития погоды и объединяет их в единый вероятностный прогноз.
- Обеспечивает разрешение до 0.25° для всего земного шара.
- Превышает точность лучших существующих систем прогнозирования в 97.2% случаев!
Как быстро он работает?
- Всего за 8 минут создаёт 15-дневный прогноз при помощи Google Cloud TPU v5. Для традиционных систем это занимает часы работы на суперкомпьютерах!
Особенно точен в прогнозах экстремальной погоды:
- Тайфунов и ураганов
- Аномально высоких и низких температур
- Сильнейших ветров
Открытый доступ:
Google DeepMind предоставляет исходный код модели и её весовые коэффициенты всем желающим, чтобы способствовать развитию метеорологии.
▪ Статья: https://deepmind.google/discover/blog/gencast-predicts-weather-and-the-risks-of-extreme-conditions-with-sota-accuracy/
▪ Github: https://github.com/google-deepmind/graphcast
@machinelearning_ru
❤8👍5🔥4👎2