Giới thiệu

Trong Chương 2, chúng ta đã khám phá cách sử dụng tokenizer và các mô hình huấn luyện trước để đưa ra dự đoán. Nhưng nếu bạn muốn tinh chỉnh một mô hình được huấn luyện trước cho tập dữ liệu của riêng mình thì sao? Đó là chủ đề của chương này! Bạn sẽ học:

Cách chuẩn bị một tập dữ liệu lớn từ Hub
Cách sử dụng API Trainer cấp cao để tinh chỉnh mô hình
Cách sử dụng vòng lặp huấn luyện tùy chỉnh
Cách tận dụng thư viện 🤗 Accelerate để dễ dàng chạy vòng huấn luyện tùy chỉnh đó trên bất kỳ thiết lập phân tán nào

Để tải các checkpoint được huấn luyện của bạn lên Hugging Face Hub, bạn sẽ cần có tài khoản huggingface.co: tạo tài khoản

< > Update on GitHub

NLP Course

Giới thiệu