Link

GlossarioInfoPrivacy

Social

© 2026 CryptoGlossario

v2.0admin
CryptoGlossario
Aggiunto il 29/01/2026
🤖AI🖥️Informatica

Evals

SlangNeologismoTecnico

Test standardizzati per misurare le prestazioni di un modello AI su compiti specifici: accuratezza, ragionamento, codice o capacità di seguire istruzioni.

Gli evals si basano su dataset di riferimento con risposte attese, chiamati benchmark. Ogni test misura una capacità distinta: un eval di matematica non rivela nulla sulla capacità di scrivere codice. Il risultato è un punteggio che consente confronti tra modelli diversi o versioni successive dello stesso. Nel ciclo di sviluppo AI, gli evals guidano le scelte di addestramento e segnalano regressioni dopo ogni aggiornamento del modello.

Prestito integrale dall'inglese

Termine usato soprattutto nella forma originale

In italiano questo termine circola soprattutto in inglese o nella forma originale. Nel glossario non viene forzata una traduzione perché la forma d'uso più naturale resta quella internazionale.

Termini Correlati

Broadly Safe

 

3.3x
🤖AI🖥️Informatica

Criterio di AI safety che richiede a un'intelligenza artificiale di evitare qualsiasi danno grave, anche a costo di risultare meno utile o di rifiutare richieste lecite.

Coding Agents

Agenti di coding

2.4x
🤖AI🖥️Informatica

Agenti AI autonomi capaci di scrivere, modificare, eseguire e correggere codice sorgente per completare compiti di sviluppo software con supervisione umana minima.

Benchmark

 

≈2.0x
🤖AI🖥️Informatica💰Finanza

Test o riferimento standard usato per misurare e confrontare le prestazioni di sistemi, modelli AI o investimenti rispetto a un punto di confronto condiviso.

Pass@k

 

1.6x
🤖AI🖥️Informatica

Metrica AI che misura la capacità di un modello di risolvere un problema in k tentativi: il test è superato se almeno una delle k soluzioni generate risulta corretta.

Benchmark

 

1.4x
🤖AI

Test standardizzato che misura le capacità di un modello AI in aree specifiche (logica, matematica, programmazione, linguaggio), permettendo il confronto diretto tra modelli diversi.

Light Client Bridge

Ponte light client

1.4x
🤖AI🔐Crittografia🖥️Informatica

Ponte cross-chain che integra un client leggero della blockchain sorgente nella catena di destinazione per verificare le transazioni senza intermediari fidati.