Text Generation
Transformers
PyTorch
Chinese
English
llama
text-generation-inference

请问这个sft用到了哪些数据,总共是多少量级?

#7
by Kuaixueshiqing - opened

如题。感谢您的分享。

如readme,使用了sharegpt,中文翻译的sharegpt,cot和中文cot,力扣题解,少量身份认知数据(fastchat dummy),总计约200k条数据

Sign up or log in to comment