Aggiunto il 15/05/2026
Evaluation Pipeline
Pipeline di valutazione
ENEvaluation Pipeline · pl. Evaluation Pipelines
ITPipeline di valutazione · gen. f. · inv.
Sequenza automatizzata di test che misura la qualità di un modello, di un agente o di un sistema AI su esempi, metriche e casi limite definiti.
Una evaluation pipeline trasforma la valutazione da controllo manuale occasionale a processo ripetibile. Raccoglie dataset di prova, esegue il sistema da testare, calcola metriche e segnala regressioni rispetto a versioni precedenti. Nei modelli generativi può includere valutazioni automatiche, giudizi umani, rubriche qualitative e test di sicurezza. È diversa da una singola benchmark run: serve a controllare nel tempo se un cambiamento di prompt, modello, retrieval o strumento migliora davvero il comportamento complessivo.