sourcegraph
diff --git a/‎README.md‎
Lines changed: 7 additions & 9 deletions b/‎README.md‎
Lines changed: 7 additions & 9 deletions
diff --git a/‎ralph/configs/bigcode_3config.sh‎ ‎configs/bigcode_3config.sh‎ralph/configs/bigcode_3config.sh renamed to configs/bigcode_3config.sh b/‎ralph/configs/bigcode_3config.sh‎ ‎configs/bigcode_3config.sh‎ralph/configs/bigcode_3config.sh renamed to configs/bigcode_3config.sh
diff --git a/‎ralph/configs/bigcode_3config.yaml‎ ‎configs/bigcode_3config.yaml‎ralph/configs/bigcode_3config.yaml renamed to configs/bigcode_3config.yaml b/‎ralph/configs/bigcode_3config.yaml‎ ‎configs/bigcode_3config.yaml‎ralph/configs/bigcode_3config.yaml renamed to configs/bigcode_3config.yaml
diff --git a/‎ralph/configs/k8s_docs_3config.sh‎ ‎configs/k8s_docs_3config.sh‎ralph/configs/k8s_docs_3config.sh renamed to configs/k8s_docs_3config.sh b/‎ralph/configs/k8s_docs_3config.sh‎ ‎configs/k8s_docs_3config.sh‎ralph/configs/k8s_docs_3config.sh renamed to configs/k8s_docs_3config.sh
diff --git a/‎ralph/configs/k8s_docs_3config.yaml‎ ‎configs/k8s_docs_3config.yaml‎ralph/configs/k8s_docs_3config.yaml renamed to configs/k8s_docs_3config.yaml b/‎ralph/configs/k8s_docs_3config.yaml‎ ‎configs/k8s_docs_3config.yaml‎ralph/configs/k8s_docs_3config.yaml renamed to configs/k8s_docs_3config.yaml
diff --git a/‎ralph/configs/locobench_3config.sh‎ ‎configs/locobench_3config.sh‎ralph/configs/locobench_3config.sh renamed to configs/locobench_3config.sh b/‎ralph/configs/locobench_3config.sh‎ ‎configs/locobench_3config.sh‎ralph/configs/locobench_3config.sh renamed to configs/locobench_3config.sh
diff --git a/‎ralph/configs/locobench_3config.yaml‎ ‎configs/locobench_3config.yaml‎ralph/configs/locobench_3config.yaml renamed to configs/locobench_3config.yaml b/‎ralph/configs/locobench_3config.yaml‎ ‎configs/locobench_3config.yaml‎ralph/configs/locobench_3config.yaml renamed to configs/locobench_3config.yaml
diff --git a/‎ralph/configs/swebenchpro_3config.sh‎ ‎configs/swebenchpro_3config.sh‎ralph/configs/swebenchpro_3config.sh renamed to configs/swebenchpro_3config.sh b/‎ralph/configs/swebenchpro_3config.sh‎ ‎configs/swebenchpro_3config.sh‎ralph/configs/swebenchpro_3config.sh renamed to configs/swebenchpro_3config.sh
diff --git a/‎ralph/configs/swebenchpro_3config.yaml‎ ‎configs/swebenchpro_3config.yaml‎ralph/configs/swebenchpro_3config.yaml renamed to configs/swebenchpro_3config.yaml b/‎ralph/configs/swebenchpro_3config.yaml‎ ‎configs/swebenchpro_3config.yaml‎ralph/configs/swebenchpro_3config.yaml renamed to configs/swebenchpro_3config.yaml
diff --git a/‎ralph/.last-branch‎
Lines changed: 1 addition & 0 deletions b/‎ralph/.last-branch‎
Lines changed: 1 addition & 0 deletions
@@ -62,11 +62,9 @@ Each benchmark directory contains:
 
 ## Metrics Extraction Pipeline
 
-The `ralph/scripts/` directory contains a stdlib-only Python 3.10+ pipeline for extracting deterministic metrics from Harbor run output:
+The `scripts/` directory contains a stdlib-only Python 3.10+ pipeline for extracting deterministic metrics from Harbor run output:
 
 ```bash
-cd ralph/
-
 # Generate evaluation report from Harbor runs
 python3 scripts/generate_eval_report.py \
   --runs-dir /path/to/runs/official/ \
@@ -75,7 +73,7 @@ python3 scripts/generate_eval_report.py \
 # Generate LLM judge context files
 python3 -m scripts.ccb_metrics.judge_context \
   --runs-dir /path/to/runs/official/ \
-  --benchmarks-dir ../benchmarks/ \
+  --benchmarks-dir ./benchmarks/ \
   --output-dir ./judge_contexts/
 ```
 
@@ -85,23 +83,23 @@ The report generator produces:
 - `harness_configs.json` — exact harness configuration per run
 - CSV files per table for downstream analysis
 
-See `python3 ralph/scripts/generate_eval_report.py --help` for all options.
+See `python3 scripts/generate_eval_report.py --help` for all options.
 
 ---
 
 ## Running with Harbor
 
-Each benchmark has a shell runner in `ralph/configs/` that executes all tasks across the 3-config matrix:
+Each benchmark has a shell runner in `configs/` that executes all tasks across the 3-config matrix:
 
 ```bash
 # Run all 50 LoCoBench tasks across 3 configs
-bash ralph/configs/locobench_3config.sh
+bash configs/locobench_3config.sh
 
 # Run only the baseline config
-bash ralph/configs/locobench_3config.sh --baseline-only
+bash configs/locobench_3config.sh --baseline-only
 
 # Run only MCP-Full config
-bash ralph/configs/locobench_3config.sh --full-only
+bash configs/locobench_3config.sh --full-only
 ```
 
 Available runners: `locobench_3config.sh`, `swebenchpro_3config.sh`, `bigcode_3config.sh`, `k8s_docs_3config.sh`.
 
@@ -0,0 +1 @@
+ralph/benchmark-execution-pipeline