DLStories

PEER: A Collaborative Language Model
#paper

Помните, когда вышел GPT-3, многие стали бояться, что языковые модели заменят копирайтеров и редакторов? Прямо как сейчас все боятся, что text-to-image модели заменят дизайнейров) Статьи еще тогда выходили с пугающими заголовками, типа “всю эту статью написала нейронка!”, а люди восхищались, насколько грамматически верные и логически выстроенные у GPT-3 выходят тексты. Не отличить от тех, что пишут люди.

Я к таким страхам относилась скептически. Да, тексты у GPT-3 выходят похожими на те, что пишет человек, в них сохраняется заданная тематика, логика и грамматика. Но есть одно большое “но”: мы не можем контролировать, как именно GPT-3 напишет текст. Мы можем задать общую тему текста, но не можем контроливать детали: какая у текста будет структура, какие примеры в нем будут использованы, и даже какое у текста будет настроение/мнение. Короче говоря, GPT-3 был далек от редактора: ему даже общие правки внести нельзя было.

Ребята из Meta AI*, похоже, об этом тоже всерьез задумались. И придумали PEER: коллаборативную языковую модель, которая “имитирует процесс написания текста человеком” (по крайней мере, авторы так утверждают). PEER расшифровывается как “Plan, Edit, Explain, Repeat”. Эта расшифровка отражает процесс работы модели.
А именно:
- модель генерирует текст, как обычная GPT-3;
- (стадия Plan) после этого модели в текстовом виде можно задать правки, которые нужно внести в текст. Например, “добавь больше информации об этом событии”, “убери вот это утверждение” или “перепиши шаги в виде списка”. Короче, прямо как обратная связь от редактора!
- (стадия Edit) далее модель начинает редактировать текст на основе обратной связи из прошлого пункта. Если правки подразумевают нахождение новой информации (например, “добавь дату этого события”), то модели нужно подать на вход документ, в котором эта информация сожержится.
- (стадия Explain) модель генерирует комментарии к свом правкам из предыдущего пункта. Например, “добавлен референс к JFLEG и чуть больше деталей”
- (стадия Repeat) модель повторяет стадии Plan-Edit-Explain, пока правок больше не останется.

Также PEER может генерить правки на стадии Plan сама, без помощи человека. Это имитирует то, как человек пишет текст. Сначала пишется черновик всего текста. Затем человек начинает снова просматривать текст и вносить различные правки, и делает это несколько раз (repeat).
В отличие от PEER, GPT-3 мог написать только черновик)

Архитектура PEER — обычный декодер трансформера. Как обучить модель под все описанные задачи (plan, edit, explain), довольно понятно: нужно определить вход и выход модели и собрать нужный датасет. Например, для задачи Explain вход — тройка (x_t, x_t+1, D_t) — текст в момент времени t (x_t), текст со внесенными правками (x_t+1) и коллекция документов D_t, откуда бралась информации для правок.

В обучении модели есть пара нюансов:
- во-первых, большие датасеты для таких задач собрать сложно. Поэтому авторы активно использовали синтетические примеры, которые получали из самой же модели PEER. Например, ответы модели на задачу Explain подавался на вход модели как правка к стадии Plan.
- во-вторых, для обучения модели четырем шагам plan-edit-explain-repeat использовались еще пара вспомогательных задач. Например, Undo: модель по тексту и коллекции документов должна была предсказать, какая правка была внесена в текст последней.
Более подробно об этих нюансах читайте в статье.

Ну и в заключение: результаты. Авторы протестировали модель на нескольких бенчмарках задач, похожих на шаги plan-edit-explain-repeat. Например, JFLEG — grammatical error correction dataset, ASSET — text simplification, FRUIT — датасет, который содержит тексты из Википедии, и задача — доволнить эти тексты с помощью референсных документов, и т.д. И на всех этих датасетах PEER берет SOTA.

Ну что, теперь начинаем бояться текстовых моделек? 🤓
📃Статья

*Организация признана экстремистской и ее деятельность запрещена на территории РФ

👍29🤔11🔥3❤1

4.49K views11:34