Spaces:

demo-leaderboard-backend
/

backend

Running on CPU Upgrade

Adds check for EAI Harness differences in naming across versions

by meg HF staff - opened Jul 2, 2024

←

Files changed (1) hide show

src/backend/run_eval_suite_harness.py CHANGED Viewed

@@ -4,6 +4,7 @@ import logging
 from datetime import datetime
 from lm_eval import tasks, evaluator, utils
 from src.envs import RESULTS_REPO, API
 from src.backend.manage_requests import EvalRequest
@@ -34,7 +35,12 @@ def run_evaluation(eval_request: EvalRequest, task_names: list, num_fewshot: int
             "WARNING: --limit SHOULD ONLY BE USED FOR TESTING. REAL METRICS SHOULD NOT BE COMPUTED USING LIMIT."
         )
-    task_names = utils.pattern_match(task_names, tasks.ALL_TASKS)
     logger.info(f"Selected Tasks: {task_names}")

 from datetime import datetime
 from lm_eval import tasks, evaluator, utils
+from lm_eval.tasks import TaskManager
 from src.envs import RESULTS_REPO, API
 from src.backend.manage_requests import EvalRequest
             "WARNING: --limit SHOULD ONLY BE USED FOR TESTING. REAL METRICS SHOULD NOT BE COMPUTED USING LIMIT."
         )
+    try:
+        all_tasks = tasks.ALL_TASKS
+    except AttributeError:
+        task_manager = TaskManager()
+        all_tasks = task_manager.all_tasks
+    task_names = utils.pattern_match(task_names, all_tasks)
     logger.info(f"Selected Tasks: {task_names}")