chat_template中为什么要把assistant角色中的<think>过程切掉

#18
by zhm0 - opened

推理时过程是在<|Assistant|>特殊token之后,tokenizer_config里的template将assistant中的过程直接切掉了,这样在训练的时候直接tokenize数据就会导致labels中没有think过程,请问这个设计是出于什么目的呢?

Sign up or log in to comment