© 2026 CryptoGlossario

GlossarioInfoPrivacy
v2.0
CryptoGlossario
Aggiunto il 24/03/2026
🤖AI

RLHF (Reinforcement Learning from Human Feedback)

Apprendimento per rinforzo dal feedback umano

ENRLHF (Reinforcement Learning from Human Feedback) · uso non numerabile
ITApprendimento per rinforzo dal feedback umano · uso non numerabile
AcronimoNeologismoTecnico

Tecnica di addestramento che usa le valutazioni di revisori umani per insegnare a un modello AI quali risposte sono utili, accurate e sicure, e quali vanno evitate.

Il processo funziona in tre fasi: prima il modello viene addestrato su testo generico; poi revisori umani confrontano coppie di risposte e indicano quale è migliore; infine un secondo modello (reward model) impara da quelle preferenze e guida l'addestramento del principale. È il metodo usato da ChatGPT, Claude e altri assistenti per passare da un modello generico a uno che segue istruzioni e rifiuta richieste pericolose.

Forma attestata nell'uso italiano

In italiano circola davvero una forma d'uso accanto a quella originale

In italiano si incontra davvero anche la forma "Apprendimento per rinforzo dal feedback umano". Non è una traduzione interamente italiana: è una resa ibrida italo-inglese attestata nell'uso.

Termini Correlati

AI Agent

Agente AI

2.7x
🤖AI🖥️Informatica

Sistema di intelligenza artificiale che agisce in autonomia: riceve un obiettivo, pianifica i passaggi e li esegue usando strumenti esterni senza guida continua dell'utente.

Coding Agents

Agenti di coding

2.4x
🤖AI🖥️Informatica

Agenti AI autonomi capaci di scrivere, modificare, eseguire e correggere codice sorgente per completare compiti di sviluppo software con supervisione umana minima.

Hard Constraints

Vincoli rigidi

2.2x
🤖AI🖥️Informatica

Regole inviolabili imposte a un modello AI: limiti assoluti che il sistema non può oltrepassare in nessuna circostanza, indipendentemente dalle istruzioni ricevute.

Local-First

Approccio local-first

1.8x
🤖AI🖥️Informatica

Approccio software in cui i dati restano prima sul dispositivo dell'utente e il cloud serve soprattutto per sincronizzare, condividere o fare backup.

Multi-agent

Multi-agente

1.7x
🤖AI🖥️Informatica

Architettura AI in cui più agenti indipendenti collaborano per completare un compito: ognuno ha un ruolo specializzato e può consultare gli altri o usare strumenti distinti.

Zero-shot Learning

Apprendimento zero-shot

1.7x
🤖AI

Capacità di un modello AI di svolgere un compito senza aver visto esempi specifici: risponde basandosi solo sulla comprensione generale acquisita durante l'addestramento.