Датасет emotion содержит сообщения из Твиттера, каждое сообщение помечено какой-либо эмоцией. Найдите его на Hub и изучить карточку датасета. Какая из этих эмоцией не является базовой?
2. Найдите датасет ar_sarcasm в Hub . Какую задачу можно решить с использованием этого датасета?
3. В каком формате модель BERT ожидает на вход пару предложений?
4. Какие преимущества есть у метода Dataset.map()?
5. Что такое dynamic padding?
6. Какова цель функции сопоставления (collate function)?
7. Что происходит, когда вы создаете экземпляр одного из классов AutoModelForXxx с предварительно обученной языковой моделью (например, bert-base-uncased ), которая соответствует задаче, отличной от той, для которой она была обучена?