Rocktim Jyoti Das

RocktimMBZ

AI & ML interests

None yet

Recent Activity

updated a model 1 day ago

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3_ckpt_1000

updated a model 1 day ago

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3

updated a model 2 days ago

RocktimMBZ/sft_model_merged_lamma_3_epoch_3

View all activity

Organizations

RocktimMBZ's activity

updated 2 models 1 day ago

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3_ckpt_1000

Updated 1 day ago • 6

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25_llama_3

Updated 1 day ago • 12

updated a model 2 days ago

RocktimMBZ/sft_model_merged_lamma_3_epoch_3

Updated 2 days ago • 9

updated a model 3 days ago

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_25

Updated 3 days ago • 14

updated 6 models 4 days ago

updated a model 6 days ago

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_6_beta_15

Updated 6 days ago • 19

updated 2 models 7 days ago

RocktimMBZ/dpo_model_merged_lr_2e_6_lora_64_16_epoch_4

Updated 7 days ago • 8

RocktimMBZ/dpo_model_merged_lr_4e_5_lora_64_16_epoch_1

Updated 7 days ago • 12

updated 3 models 8 days ago

RocktimMBZ/dpo_model_merged_lr_4e_5_lora_64_16_epoch_2

Updated 8 days ago • 13

RocktimMBZ/dpo_model_merged_lr_4e_5_lora_64_16

Updated 8 days ago • 8

RocktimMBZ/dpo_model_merged_lr_2e_07

Updated 8 days ago • 8

updated 3 models 9 days ago

RocktimMBZ/dpo_model_merged

Updated 9 days ago • 10

RocktimMBZ/sft_model_merged

Updated 9 days ago • 12

RocktimMBZ/sft_model

Updated 9 days ago

authored a paper about 1 month ago

MALT: Improving Reasoning with Multi-Agent LLM Training

Paper • 2412.01928 • Published Dec 2, 2024 • 40