decode_tg128_0k_q8
62 (n=1, σ=0)
decode_tg128_0k_turbo3
48.93 (n=1, σ=0)
decode_ratio_0k
0.79 (n=1, σ=0)
decode_tg128_4k_q8
58.47 (n=1, σ=0)
decode_tg128_4k_turbo3
36.4 (n=1, σ=0)
decode_ratio_4k
0.62 (n=1, σ=0)
decode_tg128_8k_q8
55.67 (n=1, σ=0)
decode_tg128_8k_turbo3
28.35 (n=1, σ=0)
decode_ratio_8k
0.51 (n=1, σ=0)
decode_tg128_16k_q8
49.39 (n=1, σ=0)
decode_tg128_16k_turbo3
19.75 (n=1, σ=0)
decode_ratio_16k
0.4 (n=1, σ=0)
decode_tg128_204k_q8
28.13 (n=1, σ=0)
decode_tg128_204k_turbo3
5.38 (n=1, σ=0)
decode_ratio_204k
0.19 (n=1, σ=0)
prefill_ratio_0k
0.96 (n=1, σ=0)
prefill_ratio_16k
1 (n=1, σ=0)
prefill_ratio_204k
1.02 (n=1, σ=0)
kv_mem_q8_total_mib
2948 (n=1, σ=0)
kv_mem_turbo3_total_mib
1361 (n=1, σ=0)
kv_compression_ratio
2.17 (n=1, σ=0)