建议用Qwen2-7B-Multilingual-RP做为底模
#15
by
jab0688
- opened
qwen2.5在nsfw支持上远低于Qwen2-7B-Multilingual-RP。
底模是 DeepSeek-R1-Distill 系列的,你说的这个模型它不支持思考,DeepSex 的特点就是 COT RP 模型
谢谢您的回复和讲解!抱歉我是小白,个人使用体验觉得qwen2这个本版对nsfw的支持是最好的,我看v2版有提到qwen2.5,如果换成qwen2不知是否会更好玩些?
This comment has been hidden
谢谢您的回复和讲解!抱歉我是小白,个人使用体验觉得qwen2这个本版对nsfw的支持是最好的,我看v2版有提到qwen2.5,如果换成qwen2不知是否会更好玩些?
qwen2.5 指的是 DeepSeek-R1-Distill 基于 qwen2.5,如果真的要换的话,需要联系幻方让他们用他们的数据集基于你提到的模型重新训练一个底模,不太现实
但是如果用现有的 COT 数据集去微调这个模型,然后再用 DeepSex 的数据集去微调的话,也许是个办法