Приглашаем Вас 24.10.2019,в четверг, в 19:00 на очередное заседание семинара "Автоматическая обработка и анализ текстов" НУЛ Моделей и методов вычислительной прагматики Департамента анализа данных и искусственного интеллекта.
Докладчик: Андрей Кутузов, University of Oslo
Тема: «Эволюция семантики слов во времени и дистрибутивные методы»
Аннотация: Дистрибутивно-семантические векторные модели (word embeddings) хорошо зарекомендовали себя в детектировании диахронических семантических сдвигов. В рамках SemEval-2020 пройдёт соревнование на эту тему. Скорее всего, большинство участников будет так или иначе использовать дистрибутивные подходы. Докладчик кратко расскажет о достигнутых результатах в этой области: продемонстрирует публично доступные, вручную размеченные тестовые сеты для русского языка, а также хорошо сработавшие алгоритмы обнаружения семантических сдвигов при помощи диахронических эмбеддингов. Также планируется обсуждение некоторых часто встречающихся ошибок при использовании дистрибутивных моделей. Семинар завершится совместным обсуждением задач, предложенных организаторами SemEval-2020.
Дата: 24.10.2019, 19:00
Место проведения: Покровский бульвар, д. 11, ауд. R206, 19:00
Сайт: https://sites.google.com/view/nlp-seminar/main
Ссылка на регистрацию: https://www.hse.ru/expresspolls/poll/311948049.html
Докладчик: Андрей Кутузов, University of Oslo
Тема: «Эволюция семантики слов во времени и дистрибутивные методы»
Аннотация: Дистрибутивно-семантические векторные модели (word embeddings) хорошо зарекомендовали себя в детектировании диахронических семантических сдвигов. В рамках SemEval-2020 пройдёт соревнование на эту тему. Скорее всего, большинство участников будет так или иначе использовать дистрибутивные подходы. Докладчик кратко расскажет о достигнутых результатах в этой области: продемонстрирует публично доступные, вручную размеченные тестовые сеты для русского языка, а также хорошо сработавшие алгоритмы обнаружения семантических сдвигов при помощи диахронических эмбеддингов. Также планируется обсуждение некоторых часто встречающихся ошибок при использовании дистрибутивных моделей. Семинар завершится совместным обсуждением задач, предложенных организаторами SemEval-2020.
Дата: 24.10.2019, 19:00
Место проведения: Покровский бульвар, д. 11, ауд. R206, 19:00
Сайт: https://sites.google.com/view/nlp-seminar/main
Ссылка на регистрацию: https://www.hse.ru/expresspolls/poll/311948049.html
Напоминаем, что всех сегодня ждём в 19:00 на семинар! Не забывайте паспорт, если у вас нет пропуска в Вышку. Для тех, кто не сможет приехать, постараемся организовать трансляцию (ссылка появится в этом канале).
Ссылки на слайды доклада Андрея (и предыдущих двух докладчиков) появились у нас на сайте: https://sites.google.com/view/nlp-seminar/main
Спасибо всем, кто вчера пришёл, и отдельное спасибо Кире Кирилловой и Владимиру Цепулину, благодаря которым у нас теперь есть трансляции семинаров!
Следующий семинар будет (ориентировочно) через три недели (немного сдвинули сроки из-за EMNLP), на нём попробуем организовать лекцию и круглый стол, посвящённые дискурсу. Детали появятся позже.
Спасибо всем, кто вчера пришёл, и отдельное спасибо Кире Кирилловой и Владимиру Цепулину, благодаря которым у нас теперь есть трансляции семинаров!
Следующий семинар будет (ориентировочно) через три недели (немного сдвинули сроки из-за EMNLP), на нём попробуем организовать лекцию и круглый стол, посвящённые дискурсу. Детали появятся позже.
Всем привет!
Приглашаем на очередное заседание семинара "Автоматическая обработка и анализ текстов" НУЛ Моделей и методов вычислительной прагматики Департамента анализа данных и искусственного интеллекта.
Тема: Анализ дискурса в задачах автоматической обработки текстов
Докладчик: Елена Чистова, ФИЦ ИУ РАН.
Аннотация: Многие задачи NLP требуют анализа текста за пределами одного предложения. Одной из наиболее широко используемых теорий для описания дискурсивной структуры текста является теория риторических структур (RST). В ней текст представляется в виде дерева составляющих, содержащего отношения (развитие, причина, фон и т.д.) между сегментами текстов. В докладе будут представлены результаты экспериментов по созданию дискурсивного анализатора на основе корпуса RuRSTreebank, содержащего разметку русскоязычных текстов нескольких жанров.
В рамках семинара пройдет круглый стол, посвященный вопросам использования анализа дискурса в задачах автоматической обработки текстов. Участники круглого стола – научные сотрудники НУИ ВШЭ и ФИУ ИУ РАН.
Дата: 14.11.2019, 19:00
Место проведения: Покровский бульвар, д. 11, ауд. D206, 19:00
Форма регистрации появится в ближайшие дни.
Приглашаем на очередное заседание семинара "Автоматическая обработка и анализ текстов" НУЛ Моделей и методов вычислительной прагматики Департамента анализа данных и искусственного интеллекта.
Тема: Анализ дискурса в задачах автоматической обработки текстов
Докладчик: Елена Чистова, ФИЦ ИУ РАН.
Аннотация: Многие задачи NLP требуют анализа текста за пределами одного предложения. Одной из наиболее широко используемых теорий для описания дискурсивной структуры текста является теория риторических структур (RST). В ней текст представляется в виде дерева составляющих, содержащего отношения (развитие, причина, фон и т.д.) между сегментами текстов. В докладе будут представлены результаты экспериментов по созданию дискурсивного анализатора на основе корпуса RuRSTreebank, содержащего разметку русскоязычных текстов нескольких жанров.
В рамках семинара пройдет круглый стол, посвященный вопросам использования анализа дискурса в задачах автоматической обработки текстов. Участники круглого стола – научные сотрудники НУИ ВШЭ и ФИУ ИУ РАН.
Дата: 14.11.2019, 19:00
Место проведения: Покровский бульвар, д. 11, ауд. D206, 19:00
Форма регистрации появится в ближайшие дни.