Baseline — pre-scaffold, no context compression

baseline

0.14

1/5

Consensus Metrics

swebench_resolve_rate 0.2 (n=1, σ=0)

patches_generated 1 (n=1, σ=0)

tasks_attempted 5 (n=1, σ=0)

avg_time_seconds 206 (n=1, σ=0)

Parameters

effective_context_tokens 8000

cr_ct false

tool_aware_prompt false

memory_budget 600

Hypothesis

Establish pre-optimization baseline resolve rate across diverse SWE-bench tasks with no context compression active