На днях в Альбукерке завершила свою работу конференция NAACL 2025 ⤵️
В этом году конференцию посетили руководитель группы «Прикладное NLP» Елена Тутубалина и руководитель группы «Вычислительная семантика» Александр Панченко.
Исследователи представили 8 статей AIRI:
⚫️ SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators (main track)
В статье описан пайплайн для генерации многоязычных данных для параллельной детоксификации, а также представлен новый датасет для этой задачи под названием SynthDetoxM.
⚫️ Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models (main track)
Исследователи разработали новый метод оценки неопределённости с учителем, основанный на генерации текста с помощью расстояния Махаланобиса.
⚫️ Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models (main track)
Авторы представили новый механизм повышения качества развёрнутой модели с точки зрения производительности и справедливости прогнозирования, основанный на выборочном устранении смещений.
⚫️ LLM-Microscope: Uncovering the Hidden Role of Punctuation in Context Memory of Transformers (findings)
Авторы этой статьи выяснили, что токены, кодирующие знаки препинания, артикли и стоп-слова, играют более важную роль в обработке информации языковыми моделями, чем считалось ранее.
⚫️ How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM? (findings)
Авторы исследовали, можно ли внедрять новые факты в LLM с использованием LoRA без ущерба для ранее полученных знаний.
⚫️ SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection (SRW)
В данной статье предлагается SkipCLM — новый метод улучшения многоязычного машинного перевода в декодерах-трансформерах.
⚫️ Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images (SRW)
В статье описан новый метод оценки согласованности изображений с использованием LVLM и энкодера на основе архитектуры трансформера.
⚫️ SPY: Enhancing Privacy with Synthetic PII Detection Dataset (SRW)
Статья посвящена новому датасету SPY, который может быть полезен в задаче обнаружения персональных данных, позволяющих идентифицировать человека.
Делимся фотографиями с конференции!
В этом году конференцию посетили руководитель группы «Прикладное NLP» Елена Тутубалина и руководитель группы «Вычислительная семантика» Александр Панченко.
Исследователи представили 8 статей AIRI:
В статье описан пайплайн для генерации многоязычных данных для параллельной детоксификации, а также представлен новый датасет для этой задачи под названием SynthDetoxM.
Исследователи разработали новый метод оценки неопределённости с учителем, основанный на генерации текста с помощью расстояния Махаланобиса.
Авторы представили новый механизм повышения качества развёрнутой модели с точки зрения производительности и справедливости прогнозирования, основанный на выборочном устранении смещений.
Авторы этой статьи выяснили, что токены, кодирующие знаки препинания, артикли и стоп-слова, играют более важную роль в обработке информации языковыми моделями, чем считалось ранее.
Авторы исследовали, можно ли внедрять новые факты в LLM с использованием LoRA без ущерба для ранее полученных знаний.
В данной статье предлагается SkipCLM — новый метод улучшения многоязычного машинного перевода в декодерах-трансформерах.
В статье описан новый метод оценки согласованности изображений с использованием LVLM и энкодера на основе архитектуры трансформера.
Статья посвящена новому датасету SPY, который может быть полезен в задаче обнаружения персональных данных, позволяющих идентифицировать человека.
Делимся фотографиями с конференции!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
В вузах идёт приём заявок в магистратуру — делимся программами, которые рекомендуют исследователи AIRI ⤵️
🔳 Сколтех
«Науки о данных», «Передовые производственные технологии» и «Современные вычислительные методы»
🔳 МФТИ
«Методы и технологии ИИ» и «Интеллектуальный анализ данных»
🔳 ВШЭ
«Искусственный интеллект», «Математика машинного обучения» и «Науки о данных»
🔳 МГУ
«Компьютерное зрение, графика и обработка изображений»
🔳 Университет Иннополис
«Искусственный интеллект и инженерия данных»
🔳 МТУСИ
«Информатика и вычислительная техника»
🔳 ИТМО
«AI Talent Hub»
🔳 Центральный университет
«Машинное обучение»
Подавайте заявки и отправляйте пост друзьям, которые хотят поступить в магистратуру в этом году 🎓
«Науки о данных», «Передовые производственные технологии» и «Современные вычислительные методы»
«Методы и технологии ИИ» и «Интеллектуальный анализ данных»
«Искусственный интеллект», «Математика машинного обучения» и «Науки о данных»
«Компьютерное зрение, графика и обработка изображений»
«Искусственный интеллект и инженерия данных»
«Информатика и вычислительная техника»
«AI Talent Hub»
«Машинное обучение»
Подавайте заявки и отправляйте пост друзьям, которые хотят поступить в магистратуру в этом году 🎓
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Совместно с Университетом Иннополис открыли лабораторию мультимодального генеративного ИИ 🚀
Соглашение о создании совместной научной лаборатории на XVI Международном экономическом форуме «Россия — Исламский мир: KazanForum» подписали заместитель директора по развитию цифровых проектов российского ИТ-вуза Алексей Павлов и генеральный директор Института AIRI Иван Оселедец. Руководителем лаборатории стал кандидат технических наук, директор лаборатории FusionBrain AIRI Андрей Кузнецов.
Основным направлением работы совместной лаборатории будет изучение мультимодальных моделей и их практическое применение в промышленности. Также в планах работы лаборатории — развитие студенческой научно-исследовательской деятельности, разработка совместных образовательных программ и коммерческих проектов в сфере генеративного искусственного интеллекта.
Рады начать совместную работу!
Соглашение о создании совместной научной лаборатории на XVI Международном экономическом форуме «Россия — Исламский мир: KazanForum» подписали заместитель директора по развитию цифровых проектов российского ИТ-вуза Алексей Павлов и генеральный директор Института AIRI Иван Оселедец. Руководителем лаборатории стал кандидат технических наук, директор лаборатории FusionBrain AIRI Андрей Кузнецов.
Основным направлением работы совместной лаборатории будет изучение мультимодальных моделей и их практическое применение в промышленности. Также в планах работы лаборатории — развитие студенческой научно-исследовательской деятельности, разработка совместных образовательных программ и коммерческих проектов в сфере генеративного искусственного интеллекта.
Рады начать совместную работу!
Please open Telegram to view this post
VIEW IN TELEGRAM
Приглашаем на четвертый Большой Семинар AIRI, который пройдет 27 мая в 19:00 ⤵️
Докладчиком выступит профессор, д.м.н, Председатель Ученого Совета ГК Медси, научный руководитель и руководитель Центра Диагностики и инновационных медицинских технологий КДЦ Медси Коновалов Геннадий Александрович.
Тема выступления: «Диагностика и клиническая значимость пациентов с гипер Лп(а) холестеринемией».
Модератор Большого Семинара AIRI — доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец.
📌 Подробное описание лекции и регистрация на очный формат по ссылке. Трансляция пройдет в VK Видео и на YouTube. Сбор гостей начинается с 18:30.
До встречи!
Докладчиком выступит профессор, д.м.н, Председатель Ученого Совета ГК Медси, научный руководитель и руководитель Центра Диагностики и инновационных медицинских технологий КДЦ Медси Коновалов Геннадий Александрович.
Тема выступления: «Диагностика и клиническая значимость пациентов с гипер Лп(а) холестеринемией».
Модератор Большого Семинара AIRI — доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец.
До встречи!
Please open Telegram to view this post
VIEW IN TELEGRAM
Заключили соглашение о сотрудничестве с Академией наук Республики Татарстан 💡
Генеральный директор Института AIRI Иван Оселедец и Президент Академии наук Республики Татарстан Рифкат Минниханов подписали меморандум о стратегическом сотрудничестве, направленном на развитие научно-исследовательской деятельности в сфере искусственного интеллекта.
Подписание состоялось на площадке XVI Международного экономического форума «Россия – Исламский мир: KazanForum».
В рамках соглашения стороны сосредоточатся на разработке инновационных решений, включая LLM-модели, адаптированные для тюркских языков. Это поможет преодолеть барьеры в их цифровой обработке и сохранить языковое наследие.
Рады начать работу над общими задачами!
Генеральный директор Института AIRI Иван Оселедец и Президент Академии наук Республики Татарстан Рифкат Минниханов подписали меморандум о стратегическом сотрудничестве, направленном на развитие научно-исследовательской деятельности в сфере искусственного интеллекта.
Подписание состоялось на площадке XVI Международного экономического форума «Россия – Исламский мир: KazanForum».
В рамках соглашения стороны сосредоточатся на разработке инновационных решений, включая LLM-модели, адаптированные для тюркских языков. Это поможет преодолеть барьеры в их цифровой обработке и сохранить языковое наследие.
Рады начать работу над общими задачами!
Please open Telegram to view this post
VIEW IN TELEGRAM
В следующую среду встречаемся на #AIRI_Seminars в нашем офисе и онлайн⤵️
21 мая в 17:00 руководитель группы «Базовые Модели» лаборатории «Сильный ИИ в медицине» AIRI Дмитрий Умеренков рассмотрит базовые модели в медицинском CV и их применение к рентгенам ОГК — классификация, генерация текста, visual grounding. Также докладчик расскажет о задачах, которые пока остаются нерешёнными.
Оппонентом выступит Максим Шараев, кандидат физико-математических наук, старший преподаватель Центра ИИ и руководитель лаборатории Биомедицинского ИИ Сколтеха.
📌 Регистрация на семинар на сайте.
VK Видео | YouTube
21 мая в 17:00 руководитель группы «Базовые Модели» лаборатории «Сильный ИИ в медицине» AIRI Дмитрий Умеренков рассмотрит базовые модели в медицинском CV и их применение к рентгенам ОГК — классификация, генерация текста, visual grounding. Также докладчик расскажет о задачах, которые пока остаются нерешёнными.
Оппонентом выступит Максим Шараев, кандидат физико-математических наук, старший преподаватель Центра ИИ и руководитель лаборатории Биомедицинского ИИ Сколтеха.
VK Видео | YouTube
Please open Telegram to view this post
VIEW IN TELEGRAM
В новом дайджесте — подборка свежих материалов с участием исследователей AIRI ⤵️
⚫️ Доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец на канале «Основа» — большой выпуск о том, как устроен искусственный интеллект: VK Видео, YouTube.
⚫️ Совместно с TRASSIR завершили первый этап исследования применения мультимодальных моделей для задач видеоаналитики — рассказываем, какие выводы сделали.
⚫️ Доктор компьютерных наук, руководитель группы «Прикладное NLP» AIRI, старший научный сотрудник ИСП РАН Елена Тутубалина выступила на международном экономическом форуме «Россия — Исламский мир: KazanForum» в сессии «ИИ в области NLP: состояние и перспективы».
⚫️ Колонка руководителя группы мультимодального ИИ лаборатории Fusion Brain AIRI Елизаветы Гончаровой в Снобе про то, как устроен процесс сравнения моделей: какие существуют универсальные бенчмарки, и почему невозможно полностью повторить результаты тестов.
⚫️ Команда «Доверенные и безопасные интеллектуальные системы» AIRI рассказала о том, как современные технологии делают жизнь людей безопаснее, — в эфире программы «Зелёный переход» на телеканале Россия 24 (таймкод: 6:22).
⚫️ Иван Оселедец стал лауреатом премии AI Awards 2025, организованной командой по развитию ИИ и больших данных — билайн Big Data & AI, в номинации «Личный вклад в развитие ИИ». Увидеть список всех победителей можно в материале на сайте издания «Код Дурова».
⚫️ Новый инструмент LLM — Deep Research: что это такое, как он помогает исследователям и может ли изменить подход к науке. Подробности — в первом выпуске совместного блога AIRI и N + 1.
⚫️ Колонка младшего научного сотрудника группы «Прикладное NLP» AIRI Никиты Сушко для проекта «Неискусственный интеллект» про то, чем Ян Лекун предлагает заменить LLM.
⚫️ Запись пленарной сессии с участием Ивана Оселедца в рамках международного научного форума «Шаг в будущее: глобальный форсайт, искусственный интеллект и стратегическое лидерство».
⚫️ Новый блог AIRI и N + 1 про программирование с помощью ИИ: что такое вайб-программирование, почему оно стало популярным, и какие риски несёт автоматизация кода.
#дайджест_AIRI
#дайджест_AIRI
Please open Telegram to view this post
VIEW IN TELEGRAM
Как стать востребованным специалистом в ИИ — в новой колонке для РБК Трендов ⤵️
Доктор компьютерных наук, руководитель группы «Прикладное NLP» в AIRI и старший научный сотрудник ИСП РАН Елена Тутубалина рассказывает, с чего начать путь в области искусственного интеллекта и какие навыки действительно ценятся на рынке.
📎 Читайте материал по ссылке.
Доктор компьютерных наук, руководитель группы «Прикладное NLP» в AIRI и старший научный сотрудник ИСП РАН Елена Тутубалина рассказывает, с чего начать путь в области искусственного интеллекта и какие навыки действительно ценятся на рынке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи AIRI разработали новую архитектуру LAGNet, ускоряющую расчет электронной плотности молекул для создания новых лекарств с помощью нейросетей 💡
При предсказании свойств химических веществ часто необходимо вычислять электронную плотность молекул. Нейросети позволяют проводить эту работу быстрее традиционных подходов, но требуют огромных ресурсов для начального обучения модели.
LAGNet решает эту проблему, используя решетку Лебедева — математический подход, разработанный в СССР в 1980-х для оптимального распределения точек на сфере. Примененный к новой постановке задачи, он сокращает объем данных для обучения в 42 раза и требования к хранилищу — в 8 раз. LAGNet обучается в 4 раза быстрее аналогов за счет снижения нагрузки на каналы передачи данных и показывает лучшую точность при работе с лекарственными молекулами.
Научная статья вышла в журнале Journal of Cheminformatics, а код уже доступен на GitHub.
🔖 Подробнее — в материале ТАСС.
При предсказании свойств химических веществ часто необходимо вычислять электронную плотность молекул. Нейросети позволяют проводить эту работу быстрее традиционных подходов, но требуют огромных ресурсов для начального обучения модели.
LAGNet решает эту проблему, используя решетку Лебедева — математический подход, разработанный в СССР в 1980-х для оптимального распределения точек на сфере. Примененный к новой постановке задачи, он сокращает объем данных для обучения в 42 раза и требования к хранилищу — в 8 раз. LAGNet обучается в 4 раза быстрее аналогов за счет снижения нагрузки на каналы передачи данных и показывает лучшую точность при работе с лекарственными молекулами.
Научная статья вышла в журнале Journal of Cheminformatics, а код уже доступен на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня делимся расписанием докладов исследователей Института на Data Fest 2025 ⤵️
24 мая в гостях у VK
⚫️ 15:10 — Евгений Фролов «Ускоряем инференс на графовых моделях для теплого старта»
⚫️ 16:40 — Данил Гусак «Масштабирование функций потерь для последовательных рекомендаций с большими каталогами айтемов»
25 мая в офисе Яндекса
⚫️ 17:10 — Виктория Чекалина «Быстрая аппроксимация матрицы Фишера с помощью факторизации Кронекера для эффективного сжатия LLM»
⚫️ 17:40 — Милена Газдиева «Генеративные модели, устойчивые к несовершенствам данных, на основе теории несбалансированного оптимального транспорта»
30 мая в офисе Сбера
⚫️ 11:40 — Иван Оселедец «Большие языковые модели в эпоху ризонинга»
⚫️ 13:20 — Андрей Кузнецов «Generative Design for Construction and Industry»
⚫️ 13:20 — Айдар Булатов «Как научить LLM работать с огромным контекстом»
⚫️ 15:20 — Постерная сессия с исследователями AIRI
⚫️ 16:45 — Дмитрий Юдин «Фундаментальные модели для построения карт знаний в современной робототехнике»
Увидимся!
24 мая в гостях у VK
25 мая в офисе Яндекса
30 мая в офисе Сбера
Увидимся!
Please open Telegram to view this post
VIEW IN TELEGRAM
Приглашаем на следующий AIRI Seminars, который пройдет 4 июня в 17:00 ⤵️
⚫️ Тема: «Исследование методов и разработка алгоритмов топологического картирования и локализации».
⚫️ Докладчик: Кирилл Муравьев, аспирант и младший научный сотрудник ФИЦ ИУ РАН, научный сотрудник Центра когнитивного моделирования МФТИ.
⚫️ Оппонент: Александр Катруца, старший научный сотрудник в AIRI и научный сотрудник в Сколтехе.
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
Подробное описание и регистрация на офлайн-формат на сайте.
YouTube | VK Видео
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня подписали соглашение о сотрудничестве с Фондом Сколково 🚀
На технологической конференции Startup Village доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец и управляющий директор Центра экспертизы и коммерциализации в секторе информационных и финансовых технологий Фонда «Сколково» Павел Новиков торжественно заключили соглашение.
Начинаем сотрудничество с инициатив в рамках платформы ProGenAI, направленной на внедрение технологий генеративного ИИ в промышленный сектор. Этот проект объединяет усилия ведущих технокомпаний, научных центров и промпредприятий для создания комплексной экосистемы разработки и внедрения инновационных решений.
Рады начать совместную работу!
На технологической конференции Startup Village доктор физико-математических наук, профессор РАН, генеральный директор AIRI Иван Оселедец и управляющий директор Центра экспертизы и коммерциализации в секторе информационных и финансовых технологий Фонда «Сколково» Павел Новиков торжественно заключили соглашение.
Начинаем сотрудничество с инициатив в рамках платформы ProGenAI, направленной на внедрение технологий генеративного ИИ в промышленный сектор. Этот проект объединяет усилия ведущих технокомпаний, научных центров и промпредприятий для создания комплексной экосистемы разработки и внедрения инновационных решений.
Рады начать совместную работу!
Please open Telegram to view this post
VIEW IN TELEGRAM