moreh
/

MoMo-72B-lora-1.8.7-DPO

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

leejunhyeok commited on Mar 13

Commit

6b0c101

•

1 Parent(s): 93cbb1f

Update README.md

remove wrong tags

Files changed (1) hide show

README.md +2 -10

README.md CHANGED Viewed

@@ -2,18 +2,10 @@
 license: mit
 language:
 - en
-- id
-datasets:
-- Ichsan2895/alpaca-gpt4-indonesian
 metrics:
 - accuracy
-- character
-library_name: keras
-pipeline_tag: text-generation
-tags:
-- code
-- biology
-- finance
 ---
 # **Introduction**
 MoMo-72B-lora-1.8.7-DPO is trained via Direct Preference Optimization([DPO](https://arxiv.org/abs/2305.18290)) from [MoMo-72B-LoRA-V1.4](https://huggingface.co/moreh/MoMo-72B-LoRA-V1.4) as its base model, with several optimizations in hyperparameters.

 license: mit
 language:
 - en
 metrics:
 - accuracy
+library_name: pytorch
 ---
 # **Introduction**
 MoMo-72B-lora-1.8.7-DPO is trained via Direct Preference Optimization([DPO](https://arxiv.org/abs/2305.18290)) from [MoMo-72B-LoRA-V1.4](https://huggingface.co/moreh/MoMo-72B-LoRA-V1.4) as its base model, with several optimizations in hyperparameters.