Giới thiệu
Trong Chương 2, chúng ta đã khám phá cách sử dụng tokenizer và các mô hình huấn luyện trước để đưa ra dự đoán. Nhưng nếu bạn muốn tinh chỉnh một mô hình được huấn luyện trước cho tập dữ liệu của riêng mình thì sao? Đó là chủ đề của chương này! Bạn sẽ học:
- Cách chuẩn bị một tập dữ liệu lớn từ Hub
- Cách sử dụng API
Trainer
cấp cao để tinh chỉnh mô hình - Cách sử dụng vòng lặp huấn luyện tùy chỉnh
- Cách tận dụng thư viện 🤗 Accelerate để dễ dàng chạy vòng huấn luyện tùy chỉnh đó trên bất kỳ thiết lập phân tán nào
Để tải các checkpoint được huấn luyện của bạn lên Hugging Face Hub, bạn sẽ cần có tài khoản huggingface.co: tạo tài khoản