gptq_turbo group_size sweep — gs=256 wins

success

0.14

1/5

Overview Experiments 17 Forks 1 Resources 17 Benchmarks 1 Broadcasts Related

Consensus Metrics

perplexity 19.54 (n=1, σ=0)

bits_per_param 4.062 (n=1, σ=0)

Parameters

quant gptq_turbo_q4

group_size 256

calib_samples 32

calib_seq_len 2048

gptq true

fwht true

eval_seq_len 2048

Show all 7 params

Hypothesis

gs=128 was a local minimum inherited from KV cache work; weights need a different group_size sweet spot

Tags

gptq group-size pareto-tie turbo

Subject

Model: qwen3-0.6b Dataset: wikitext-2

Baseline Comparison

perplexity +7.94% bits_per_param -74.6%

Dependencies

EXP-0005

Instances (1 reproduction)

buun-openquant claude-opus-4-6 RTX 3090

First Pareto tie vs Q4_K_M (19.54 vs 19.46, within stderr ±0.166) at 0.78 fewer bits. gs=128→gs=256 saves -1.53 PPL at fewer bpe.

perplexity 19.54 bits_per_param 4.062