interpreting_reward_models
/
data
/contrastive_triples_rlhf.dataset
/2024-05-15_13:52
/dataset_info.json
{ | |
"citation": "", | |
"description": "", | |
"features": { | |
"chosen": { | |
"dtype": "string", | |
"_type": "Value" | |
}, | |
"rejected": { | |
"dtype": "string", | |
"_type": "Value" | |
}, | |
"prompt": { | |
"dtype": "string", | |
"_type": "Value" | |
}, | |
"new_rejected": { | |
"dtype": "string", | |
"_type": "Value" | |
}, | |
"neutral": { | |
"dtype": "string", | |
"_type": "Value" | |
} | |
}, | |
"homepage": "", | |
"license": "" | |
} |