LLM Course documentation
Модели-декодировщики
0. Установка
1. Трансформеры
ВведениеОбработка естественного языкаТрансформеры: на что они способны?Как работают трансформеры?Модели-кодировщикиМодели-декодировщикиМодели "seq2seq"Предвзятости и ограниченияИтогиТест в конце главы
2. Использование 🤗 Transformers
3. Fine-tuning предобученной модели
4. Hugging Face Hub
5. Библиотека 🤗 Datasets
6. Бибилиотека 🤗 Tokenizers
7. Основные задачи NLP
8. Как попросить о помощи
9. Создание и распространение демо
События курса
Глоссарий
Модели-декодировщики
Декодировщики используют только компонент декодирования трансформера. На каждом этапе для текущего слова слой внимания может получить доступ только к словам, которые были расположены до него в предложении. Такие модели часто называются авторегрессионными моделями.
Процесс предобучения декодировщиков обычно заключается в предсказании следующего слова в предложении.
Такие модели лучше всего подходят для задач, связанных с генерацией текста.
Представителями этого семейства моделей являются:
Update on GitHub