如题,训练100k,超过32k,很容易出现重复的情况,rope base不改,max position embedding 和max len改为100k。
· Sign up or log in to comment