Calibración experta

Revisión humana de los veredictos del juez LLM.

1. Datos del juez

Los casos del juez LLM se cargan desde la evaluación activa (página «Cargar evaluación» + servidor local).

Sin datos cargados.

Suba report_*.json (casos + juez) o pipeline2_llm_judge_calls.jsonl

Configurar muestra de revisión