Telegram Web Link
агенты ускоряют разработку в 10тки раз
Bytedance дропнули открытый вриант GPT image, понимает картинки и видео, генерирует текст и картинки, умеет редактировать.

MoT архитектура с 7б активных и 14б всего параметров, бьет и vlm и сопоставимого размера t2i хотя качество не SOTA имхо.

hf
This media is not supported in your browser
VIEW IN TELEGRAM
а, еще дали доступ к veo3, у меня нет прям восторга, но в целом бодро
Forwarded from black_samorez
Рассказал на датафесте доклад про оптимальность спортивок для LLM резерча.
Whait whait whait whait.....
Is it real?
Love. Death. Transformers.
Whait whait whait whait..... Is it real?
https://pub.sakana.ai/sudoku/

Ну... Goal?
Tldr ллм не очень умеют решать sudoku, решится либо форматом либо дотреном.
https://www.tg-me.com/imaxairu/16349

умоляю дайте этим челам грант им очень надо они СУВЕРЕННЫЙ АИ делают, не то что мы дебилы лламы какие то учим, бенчи меряем, да нахуя все это, три вопроса про пролетариат, пртрен на 20б токенов и ПО ГНА ЛИ!!!!

А агентность, польза от ллм и код это вообще навязанные западом стереотипы, random parrots are not supposed to solve math tasks, they cant think а блин это в другом чате тролить


ПРограммирование и бенчмарки это навязанный западом нарратив и стереотип, на руси испокон веков хуярили ВАЙБ бенчмарки, вот генерит модель фанфик про попаданцев - значит русская, а код и MCP этот ваш нахуй не нужон
пост для вашего крижевания и комментов
eastern europeans live like this and see no problem
ВЫРАВНИВАНИЕ ИСКУССТВЕННОЙ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ — регламентированная совокупность взаимосвязанных организационно-технических, программно-алгоритмических и контрольно-надзорных мероприятий по приведению функциональных, эксплуатационных и выходных характеристик систем искусственного интеллекта в полное соответствие с требованиями:

НОРМАТИВНО-ПРАВОВОЙ БАЗЫ:
- ГОСТ Р 59276-2020 п.п. 4.1.1-4.1.17, 5.2.1-5.2.15;
- ГОСТ Р ИСО/МЭК 23053-2021 разделы 6-12;
- ГОСТ Р ИСО/МЭК 23094-2021 приложения А-Г;
- СТ РК ИСО/МЭК 27001-2015 п. 6.1.2;
- СанПиН 1.2.3685-21 раздел VII;

ПРОЦЕДУРНЫХ РЕГЛАМЕНТОВ:
согласно Постановлению Правительства РФ, приказам федеральных органов исполнительной власти, методическим указаниям Роскомнадзора МУ-2024/15-ИИ и внутренним стандартам предприятия серии СТП-ИИ-001 по СТП-ИИ-127.

ЭТАПНОСТЬ РЕАЛИЗАЦИИ ПРОЦЕДУРЫ (в строгом соответствии с календарным планом-графиком, утверждённым техническим директором):

I ЭТАП — предварительное технико-экономическое обоснование целесообразности проведения мероприятий по выравниванию с составлением сметной документации по форме КС-2, КС-3;

II ЭТАП — разработка и согласование в установленном порядке программы и методики испытаний с привлечением аккредитованных в системе РОСАККРЕДИТАЦИЯ лабораторий;

III ЭТАП — проведение калибровочных работ с оформлением протоколов измерений согласно МИ 2427-97 и ведением журнала учёта выполненных работ по форме № ЖУР-ИИ-15/2025;

IV ЭТАП — осуществление контрольно-измерительных операций с применением эталонных средств измерений, внесённых в Государственный реестр средств измерений;

V ЭТАП — составление акта выполненных работ по форме КС-2 с приложением технического отчёта объёмом не менее 127 листов формата А4.

КРИТЕРИИ СООТВЕТСТВИЯ устанавливаются техническим заданием, разработанным в соответствии с ГОСТ 2.103-2013, и подлежат актуализации не реже одного раза в календарный год.

ОТВЕТСТВЕННОСТЬ ЗА НАРУШЕНИЕ требований настоящего определения несут должностные лица согласно штатному расписанию, утверждённому приказом генерального директора № 001-К от 01.01.2025 г., в порядке, предусмотренном Трудовым кодексом Российской Федерации и локальными нормативными актами организации.
зря вы доверили мне писать статью я сдвгшник+не умею верстать, я ебну столько инфорамации сколько влезает в каждый квадратный сантиметр.

Вот бы во всех статьях были такие графики, вот правда, никаких один график на страницу, плотная инфа и не надо туда сюда листать. Да и статья клевая
Forwarded from MS ODS
Всем привет!

После моего выступления про Межславянский переводчик сообщество проявило интерес, а основной вопрос был «Как помочь?»

Потому я решил выкладывать конкретные проблемы, которые мы пытаемся решить в рамках проекта

Присоединяйтесь, тут я буду публиковать актуальное состояние и артефакты, а в чате го обсуждать
🎧 YaMBDa: один из крупнейших open-source датасет пользовательских взаимодействий в музыкальной стриминговой среде от Яндекса

Рекомендательные системы давно страдают от нехватки реалистичных, масштабных и современных датасетов. MovieLens, Amazon Reviews, Steam и даже Criteo либо слишком малы, либо ограничены по сигналам и домену, либо плохо документированы. Это мешает исследователям разрабатывать модели, конкурентоспособные в продакшн-условиях.

Исследователи Яндекса решают эту проблему, выложив YaMBDa — датасет с 4.79 млрд событий взаимодействий пользователей с треками в Яндекс Музыке и “Моей Волне”. Это анонимизированные данные 1 млн пользователей и несколькими млн треков, включающие:
— Прослушивания (implicit feedback)
— Лайки, дизлайки, анлайки и андизлайки (explicit feedback)
— Флаг is_organic,
отличающий органические действия от тех, что были вызваны рекомендациями
— Точные timestamp’ы событий
— Нейросетевые эмбеддинги треков, полученные через сверточные сети (CNN)

— Данные распределены в формате Apache Parquet, готовом для масштабной обработки (Spark, Polars, Pandas)

Оценка алгоритмов
Для честной offline-оценки в YaMBDa используется Global Temporal Split (GTS) — это означает, что события разделяются по времени, сохраняя естественную последовательность. Это важно: в реальности мы не знаем будущего, а LOO-сплиты могут подглядывать за горизонт.

Предоставлены baseline-алгоритмы:
MostPop, DecayPop, ItemKNN, iALS, BPR, SANSA, SASRec — всё, чтобы сразу запускать эксперименты.

Метрики:
— NDCG@k: качество ранжирования
— Recall@k: полнота рекомендаций
— Coverage@k: охват элементов в рекомендациях

Большинство открытых музыкальных датасетов, таких как Music4All или Million Song Dataset, фокусируются на контенте или небольших взаимодействиях. YaMBDa — первый truly large-scale набор с поведенческой историей, органикой, временными метками и богатой структурой сигналов. С ним можно тестировать алгоритмы в разных областях, не только в музыкальных стримингах.

Hugging Face: https://huggingface.co/datasets/yandex/yambda
Forwarded from CV Time
Yandex Alchemist: открытый датасет для буста text-to-image генерации

Раньше T2I-модели обучали в один этап — претрейн на большом, довольно грязном датасете интернет-данных. В 2023 году Meta в техрепорте EMU предложили делать файнтюн на маленьком датасете исключительного качества и за счёт этого существенно бустить результат генерации. Правда, они ничего не сказали о том, как такой датасет собрать.

Команда YandexART тоже занималась этой задачей, и сегодня мы делимся результатами своей работы — датасетом Alchemist. Он состоит из 3 350 пар «картинка-текст» и имеет лицензию Apache 2.0, пользуйтесь.

Alchemist сокращает дистанцию между крутыми потюненными закрытыми моделями и открытыми, для которых такой тюнинг недоступен. Ранее сообществу был доступен только пофильтрованный на эстетичность кусочек LAION и файнтюн-датасеты под узкий домен, например аниме или живопись. LAION часто не давал существенного прироста качества, а файнтюны под узкий домен ограничивали возможности генерации за его пределами.

Ниже мы подробно рассказываем, как получить датасет уровня Alchemist, имея лишь сырой набор интернет-данных. Отметим, что весь пайплайн — про картинки. Мы считаем, что так правильно: тексты потом лучше сгенерировать синтетические.

Итак, стартуя с датасета на 10 млрд примеров, мы выбрали картинки высокого разрешения без NSFW-контента и удалили те, что содержали вотермарки, имели низкое качество и были неэстетичны. Когда осталось примерно 300 млн изображений, дальнейшее выкручивание порогов фильтрации не помогало: модели недостаточно чувствительны, чтобы отделять хорошие картинки от великолепных. Выбирать руками лучшее из такого большого набора — тоже сомнительная затея.

На этом этапе мы предположили, что предобученная диффузионка может сама знать, какие картинки хорошие, а какие — не очень. Пробовали подходы из области dataset pruning, например, пропускать картинки через модель и смотреть на значение лосса. Оказалось, что так отбираются только самые простые изображения — абстрактные иллюстрации, вроде обоев на рабочий стол. В них немного деталей и их легко моделировать, но на файнтюне от них мало толку.

В итоге нам пришлось придумать свой метод, суть которого в следующем.

1. Возьмём 1000 картинок из наших 300 млн и разметим на условно плохие (LQ) и хорошие (HQ). Хорошими будем считать те, у которых высокие эстетичность и техническое качество, умеренная наполненность контентом.
2. Смастерим общий промт, который будет содержать перечисление желаемых характеристик: “aesthetic”, “high quality” и т. д.
3. Дальше будем брать LQ- и HQ-картинки, зашумлять их до какого-то t, подавать в нашу предобученую диффузионку вместе с промтом и смотреть, что происходит со значениями в cross-attention.

Оказывается, что на основе нашей небольшой и грубой разметки можно выделить комбинации активаций в cross-attn и токенов, которые будут хорошо отделять изображения с нужными нам свойствами. Если просуммировать эти значения, получим скаляр, который и будет нашим скором качества изображения. Проскорив таким образом 300 млн картинок, мы выбрали топ-3350 — это картинки из нашего датасета.

Дальше осталось сделать тексты — исходные из интернета могут быть ошибочны, содержать лишнюю или упускать нужную информацию. Наше наблюдение: лучше всего работают умеренно подробные промты, похожие на те, которые пишет скорее увлечённый пользователь, чем профессиональный промпт-инженер. YandexVLM как раз умеет подстраиваться под нужный формат. С её помощью мы сгенерировали тексты для каждой картинки, получив датасет Alchemist.

Чтобы убедиться в обобщаемости датасета и метода, мы сделали и выложили файнтюны SD 1.5, SD 2.1, SDXL-base 1.0, SD 3.5 Medium и Large. У всех файнтюнов растёт эстетичность и наполненность генераций, которую мы называем “image complexity”. Подробнее о методике и экспериментах читайте в препринте.

Статью подготовили Валерий Старцев, Александр Устюжанин, Алексей Кириллов, Дмитрий Баранчук, Сергей Кастрюлин

CV Time
___
Meta признана экстремистской организацией, а Facebook и Instagram запрещены на территории РФ
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/07/01 11:47:57
Back to Top
HTML Embed Code: