推理时过程是在<|Assistant|>特殊token之后,tokenizer_config里的template将assistant中的过程直接切掉了,这样在训练的时候直接tokenize数据就会导致labels中没有think过程,请问这个设计是出于什么目的呢?
· Sign up or log in to comment