Telegram Web Link
⚡️ Эндрю Нг, основатель DeepLearningAI и Coursera только что выпустил новый пакет Python с открытым исходным кодом.

Быстрая смена моделей через простой строковый идентификатор. Гибкая и простая в использовании и библиотека.

Одна строка для переключения между любыми LLM:
OpenAI ➝ "openai:gpt-4o"
Claude ➝ "антропный:claude-3-5-sonnet"
Лама ➝ "оллама:ллама3"

pip install aisuite

GitHub: https://github.com/andrewyng/aisuite
🔥11👍42👎2😁2🤬1
Как сэкономить до 44% на профессиональных GPU? 💰

Профессиональные GPU стоят дорого и покупать их не всегда выгодно. Например, если вам нужно протестировать сервис или выполнить краткосрочную задачу.

Оптимальное решение — арендовать видеокарту в облаке. Тем более сейчас в Selectel вы можете сделать это с большой выгодой. Скидка на аренду GPU NVIDIA A100 (40 ГБ) — 29%, а на NVIDIA A30 (24 ГБ) доходит до 44%.

Кроме скидки, при аренде GPU в облаке Selectel вы получаете:

🔹Отсутствие переплат и тарификацию только за используемые ресурсы
🔹Экономию на инфраструктуре благодаря прерываемым облачным серверам и возможности заморозки ресурсов
🔹Широкий выбор готовых конфигураций серверов под любые задачи и возможность индивидуальной настройки

Арендуйте GPU со скидкой до 44% в облаке Selectel: https://slc.tl/k7249

Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwNnQBh
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔥 Arch — это интеллектуальный распределенный прокси-сервер уровня 7 , предназначенный для защиты, наблюдения и персонализации ваших ИИ агентов!

🌟 Созданный с использованием специально разработанных LLM, Arch решает критически важные, но недифференцированные задачи, связанные с обработкой и запросами, включая обнаружение и отклонение попыток взлома, интеллектуальный вызов «бэкэнда» API для выполнения запроса пользователя, представленного в запросе, маршрутизацию к вышестоящим LLM и предложение аварийного восстановления между ними, а также централизованное управление наблюдаемостью запросов и взаимодействиями LLM.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
🔥 nano-graphrag — библиотека для работы с Retrieval-Augmented Generation (RAG), упрощающая интеграцию графовых баз данных, таких как Neo4j, для поиска и обработки контекстных данных!

🌟 Она используется для построения эффективных систем поиска и извлечения информации с помощью графов, что актуально в задачах, связанных с естественным языком и большими языковыми моделями.

🌟 Библиотека позволяет загружать данные в графовые базы, выполнять разбиение текста на фрагменты, а также поддерживает модули для обработки запросов и работы с графами. Она интегрируется с Neo4j, используя их Graph Data Science (GDS) плагины для вычислений, что делает её подходящей для анализа сложных сетевых структур.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2👍1
👀 Я просто оставлю этот вывод Copilot здесь...

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18👍21🥰1😱1🤩1
🔍 veRL — это гибкая, эффективная и промышленная среда обучения с подкреплением (RL), разработанная для больших языковых моделей (LLM)!

💡 Обучение с подкреплением — это тип машинного обучения, в котором агент обучается принимать решения, взаимодействуя с окружающей средой, чтобы максимизировать награду. Агент выбирает действия, исходя из текущего состояния среды, и получает обратную связь в виде награды или штрафа. Основной задачей является улучшение стратегии (политики), чтобы в будущем принимать более эффективные решения. Это используется в таких областях, как игры (например, AlphaGo), робототехника, автономные системы и оптимизация процессов.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1
📖 Человек и LLM: как построить метрики для оценки моделей

💡 Оценка качества ответов языковой модели требует сложного комплексного подхода и является такой же сложной задачей, как и разработка LLM. Авторы статьи объясняют ограничения академических бенчмарков, включая проблему протечек данных и ограниченность их проверки, а также рассказывают про систему AI-тренеров в Яндексе — специально отобранных экспертов для глубокой оценки ответов модели.

🌟 Как оказалось, универсального решения для оценки LLM нет, необходимо постоянно комбинировать различные методы и регулярно проверять, насколько модель действительно полезна в реальных сценариях использования. В статье подробнее раскрывается, как это делают в Яндексе.

📖 Читать: *клик*

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥4
🖥 01-preview достигла точности более 95% на тестах безопасности CompTIA!

🌟 Очень тесная кластеризация показателей среди ведущих моделей (95,72% против 92,40 %) предполагает снижение доходности после определенных размеров моделей.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🥰3👍2🎉1
Forwarded from Machinelearning
🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct.

SmolVLM - серия компактных VLM с 2 млрд. параметров, отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами.

Архитектура SmolVLM основана на Idefics3, с несколькими отличиями:

🟢В качестве языковой основы используется SmolLM2 1.7B вместо Llama 3.1 8B;

🟢Визуальная информация сжимается в 9 раз с помощью стратегии pixel shuffle, по сравнению с 4-кратным сжатием в Idefics3;

🟢Используются патчи размером 384x384 пикселей, а не 364x364;

🟢Визуальная основа модели изменена на shape-optimized SigLIP с патчами 384x384 пикселей и внутренними патчами 14x14;

🟢Контекстное окно SmolLM2 было расширено до 16 тыс. токенов для поддержки работы с несколькими изображениями.

Модель кодирует каждый патч изображения 384x384 в 81 токен, что позволяет ей обрабатывать тестовые запросы и изображения с использованием всего 1.2 тыс. токенов, в то время как Qwen2-VL использует 16 тыс. токенов. Это преимущество приводит к значительно более высокой скорости предварительной обработки (в 3,3-4,5 раза) и генерации (в 7,5-16 раз) по сравнению с Qwen2-VL.

Для самостоятельной тонкой настройки SmolVLM можно использовать transformers и TRL. Разработчиками представлен блокнот для файнтюна на VQAv2 с использованием LoRA, QLoRA или полной тонкой настройки. SmolVLM интегрирован с TRL для DPO через CLI.

⚠️ При batch sizes=4 и 8-битной загрузке QLoRA файнтюн потребляет около ~16 GB VRAM


📌Лицензирование:  Apache 2.0


🟡Статья на HF
🟡Набор моделей
🟡Demo


@ai_machinelearning_big_data

#AI #ML #SmallVLM #Huggingface
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
📖 Руководство: Как установить NVIDIA CUDA Toolkit в Ubuntu!

💡 Набор инструментов NVIDIA Compute Unified Device Architecture (CUDA) — это программная платформа, которая позволяет разработчикам использовать вычислительную мощность обработки NVIDIA и приложений с ускорением на GPU.

🌟 Используя CUDA Toolkit, вы можете улучшить производительность, масштабируемость и эффективность в ряде приложений. К ним относятся вычисления, глубокое обучение, компьютерное зрение, игры и многое другое.

🔗 Ссылка: *клик*

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2😁2🥰1
🔍 Qwen-Agent — инструмент для построения retrieval-augmented generation (RAG) систем и работы с большими языковыми моделями (LLM)!

🌟 Он разработан для выполнения сложных задач, таких как извлечение релевантной информации из больших объемов текста, многозадачное рассуждение и пошаговая дедукция.

🌟 Qwen-Agent применяется в системах, где важно объединить модель с механизмами поиска, чтобы обрабатывать длинные контексты и решать задачи, требующие комбинированного анализа данных. Среди особенностей: обработка запросов с использованием методов BM25, векторного поиска, и распределение задач на несколько уровней агентов, каждый из которых специализируется на своих задачах. Это делает Qwen-Agent полезным для обработки длинных текстов, таких как документы, требующих понимания контекста и взаимосвязей между частями текста.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3🔥2
💡 Интересный тред том, как компании на самом деле внедряют LLM в продакшен (более 300 технических примеров, включая локальные

https://www.reddit.com/r/LocalLLaMA/comments/1h4u7au/a_nobs_database_of_how_companies_actually_deploy/

@machinelearning_ru
🔥9👍42👎1🤬1
Forwarded from Machinelearning
✔️ Эксперта Стэнфорда по дезинформации обвиняют в использовании ИИ для фальсификации заявления в суде.

В ноябре Джефф Хэнкок, основатель Лаборатории социальных сетей Стэнфорда и эксперт по технологиям и дезинформации, представил заявление по делу в суде Миннесоты, оспаривающему закон штата 2023 года, криминализирующий использование дипфейков для влияния на выборы. В 12-страничном документе профессора в защиту закона содержалось 15 ссылок, 2 из которых не удалось найти: «Дипфейки и иллюзия подлинности: когнитивные процессы, лежащие в основе восприятия дезинформации» и «Влияние дипфейковых видео на политические взгляды и поведение» – ни по указанному цифровому идентификатору объекта, ни в архивах указанных журналов. Адвокат истцов назвал ссылки "галлюцинацией искусственного интеллекта" и потребовал исключить заявление Хэнкока из материалов дела.
stanforddaily.com

✔️ World Labs анонсировал ИИ, способный генерировать интерактивные 3D-сцены по одной фотографии.

Стартап World Labs, основанный профессором в области ИИ Фэй-Фэй Ли, представил свою первую разработку: систему ИИ, которая может создавать интерактивные 3D-сцены на основе одной фотографии. В отличие от многих других систем, преобразующих фото в 3D, сцены World Labs интерактивны и модифицируемы и позволяют «войти в любое изображение и исследовать его в 3D».

Система визуализирует сцены в режиме реального времени и поддерживает управление камерой и настройку глубины резкости. Она также позволяет применять к сценам интерактивные эффекты и анимацию, например, изменять цвет объектов и динамически освещать фон. World Labs планирует выпустить свой первый продукт в 2025 году и ориентируется на разработчиков видеоигр и киностудии.
techcrunch.com

✔️ The Browser Company анонсировала Dia - браузер с ИИ.

Компания The Browser Company, разработчик браузера Arc, представила Dia - новый веб-браузер, основанный на искусственном интеллекте. Dia будет запущен в начале 2025 года и предложит пользователям ИИ-функции: "напиши следующую строку", "дай мне идею" и "резюмируй вкладку".

Dia понимает контекст всего окна браузера, может копировать ссылки из открытых вкладок и вставлять их в электронное письмо по команде пользователя. В промо-видеоролике разработчики показали, как Dia находит документ по описанию и отправляет его по электронной почте. Разработчики уверяют, что Arc продолжит свое существование, несмотря на запуск нового продукта.
theverge.com

✔️ Гибридная модель рекомендаций для интернет-пользователей на основе DL.

Гибридная модель рекомендаций HRS-IU-DL сочетает в себе методы коллаборативной фильтрации, контентной фильтрации и нейроколлаборативной фильтрации. Модель использует RNN для выявления последовательных паттернов в поведении пользователей и TF-IDF для анализа атрибутов товаров.

HRS-IU-DL справляется с проблемами традиционных рекомендательных систем - разреженность данных и холодный старт, предоставляя точные и релевантные рекомендации. Для обучения и тестирования модели использовался датасет Movielens 100k. Результаты тестов показали, что HRS-IU-DL превосходит базовые модели по метрикам RMSE, MAE, точности и полноте.
nature.com

✔️ Hugging Face опубликовал руководство для разработчиков по соблюдению Закона ЕС об ИИ.

Закон ЕС об ИИ, вступивший в силу 2 декабря 2024 года, классифицирует системы ИИ по уровням риска: неприемлемый, высокий, ограниченный и минимальный.

В большинстве случаев разработчикам систем ИИ ограниченного риска (например, чат-ботов) потребуется обеспечить прозрачность взаимодействия с пользователем и маркировать контент, созданный ИИ. Разработчикам моделей ИИ общего назначения (GPAI) необходимо предоставить подробное описание данных, использованных для обучения модели, и соблюдать законы ЕС об авторском праве, включая механизмы отказа от использования защищенных авторским правом материалов.

Hugging Face предлагает инструменты, помогающие подготовиться к соблюдению требований: Model Cards, Dataset Cards, Gradio watermarking и поддержку механизмов отказа.
huggingface.co

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Universal Soccer Understanding

👉Универсальное понимание футбольных видео : SoccerReplay-1988 - крупнейший мультимодальный датасетов.

Статья https://arxiv.org/pdf/2412.01820
Проект https://jyrao.github.io/UniSoccer/
Репо https://github.com/jyrao/UniSoccer

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥2👎1
This media is not supported in your browser
VIEW IN TELEGRAM
🔦 IC-Light V2-Разные варианты

Модели IC-Light версии 2 для тех, кому нужны более яркие варианты освещения и модификации.

Демо: https://huggingface.co/spaces/lllyasviel/iclight-v2-vary

@machinelearning_ru
👍5🔥32👎1
🔥 headshots-starter — шаблон для настройки веб-приложения, которое позволяет пользователям создавать профессиональные портретные фотографии с использованием искусственного интеллекта!

🌟 Оно работает на базе Astria AI, используя модели генеративного ИИ, и включает интеграцию с такими сервисами, как Vercel и Supabase, для развертывания и управления процессами.

🌟 Проект нацелен на генерацию изображений по загруженным фотографиям пользователей, а также имеет функционал настройки вебхуков для обработки событий, связанных с обучением модели и генерацией результатов.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍32🔥2
🌤 Революционный инструмент в области прогнозирования погоды от Google!

Команда Google DeepMind презентовала GenCast – новую модель искусственного интеллекта, способную с высокой точностью предсказывать погоду на целых 15 дней вперёд! 🎯

GenCast – ансамблевая диффузионная модель для прогнозирования погоды и рисков экстремальных погодных условий, обеспечивающая более быстрые и точные прогнозы на срок до 15 дней. GenCast была обученная на 40-летнем архиве исторических метеорологических данных ERA5 от ECMWF.

Модель, работающая на Google Cloud TPU v5, превосходит лидирующую систему прогнозирования ECMWF ENS по точности прогнозов на 97,2% в 1320 различных комбинациях тестируемых параметров. GenCast демонстрирует способность прогнозировать экстремальные погодные явления: периоды сильной жары и холода, сильные ветры и траектории тропических циклонов. Google DeepMind планирует выпустить код, веса и прогнозы модели в открытый доступ, чтобы поддержать метеорологическое сообщество.

Почему это так важно?
- В условиях изменения климата погода становится всё менее предсказуемой.
- Точные прогнозы помогают спасти жизни и сохранить имущество.
- Это способствует эффективному планированию использования возобновляемых источников энергии.

Что может GenCast?

- Генерирует более 50 различных сценариев развития погоды и объединяет их в единый вероятностный прогноз.
- Обеспечивает разрешение до 0.25° для всего земного шара.
- Превышает точность лучших существующих систем прогнозирования в 97.2% случаев!

Как быстро он работает?

- Всего за 8 минут создаёт 15-дневный прогноз при помощи Google Cloud TPU v5. Для традиционных систем это занимает часы работы на суперкомпьютерах!

Особенно точен в прогнозах экстремальной погоды:
- Тайфунов и ураганов
- Аномально высоких и низких температур
- Сильнейших ветров

Открытый доступ:
Google DeepMind предоставляет исходный код модели и её весовые коэффициенты всем желающим, чтобы способствовать развитию метеорологии.

Статья: https://deepmind.google/discover/blog/gencast-predicts-weather-and-the-risks-of-extreme-conditions-with-sota-accuracy/
Github: https://github.com/google-deepmind/graphcast

@machinelearning_ru
8👍5🔥4👎2
2025/07/14 00:15:09
Back to Top
HTML Embed Code: