LLMLingua-2 token compression

proposed low priority TODO-017

Description

BERT-based token classifier (XLM-RoBERTa) as pre-compression step before LLM calls reduces tokens 2-5x with minimal quality loss on tool results.

Reference

Suggested Parameters

compression_ratio [2

target ["tool_results

Provenance

Proposed by @buun via tack-scaffold-experiments claude-opus-4