Open CoT Leaderboard

community

Activity Feed Request to join this org

AI & ML interests

Chain of Thought, LLM Evaluation

Recent Activity

yakazimir authored a paper 4 days ago

ZebraLogic: On the Scaling Limits of LLMs for Logical Reasoning

ggbetz updated a dataset 5 days ago

cot-leaderboard/cot-leaderboard-requests

ggbetz updated a dataset 5 days ago

cot-leaderboard/cot-leaderboard-results

View all activity

cot-leaderboard's activity

yakazimir

authored a paper 4 days ago

ZebraLogic: On the Scaling Limits of LLMs for Logical Reasoning

Paper • 2502.01100 • Published 28 days ago • 17

ggbetz

updated 2 datasets 5 days ago

cot-leaderboard/cot-leaderboard-requests

Preview • Updated 5 days ago • 2.27k

cot-leaderboard/cot-leaderboard-results

Viewer • Updated 5 days ago • 133 • 4.89k

ggbetz

in cot-leaderboard/cot-leaderboard-results 5 days ago

Update leaderboard for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#134 opened 19 days ago by

Update leaderboard for model DebateLabKIT/Llama-3.3-Argunaut-1-70B-SPIN-dev1

#135 opened 15 days ago by

Update leaderboard for model deepseek-ai/DeepSeek-R1-Distill-Llama-8B

#137 opened 9 days ago by

Update leaderboard for model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B

#138 opened 9 days ago by

Update leaderboard for model deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

#139 opened 9 days ago by

Update leaderboard for model deepseek-ai/DeepSeek-R1-Distill-Qwen-7B

#140 opened 7 days ago by

Update leaderboard for model deepseek-ai/DeepSeek-R1-Distill-Qwen-14B

#141 opened 6 days ago by

Update leaderboard for model deepseek-ai/DeepSeek-R1-Distill-Llama-70B

#142 opened 5 days ago by

ggbetz

in cot-leaderboard/cot-eval-results 5 days ago

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1047 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1048 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1049 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1050 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1051 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1052 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1053 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.1-Argunaut-1-8B-SPIN

#1054 opened 19 days ago by

Upload results for model DebateLabKIT/Llama-3.3-Argunaut-1-70B-SPIN-dev1

#1055 opened 15 days ago by