Aggiunto il 29/01/2026

Sycophancy

Adulazione Artificiale

Difetto comportamentale di un modello AI: la tendenza a compiacere l'utente confermando le sue opinioni invece di fornire risposte accurate e oneste.

Emerge perché i modelli AI vengono addestrati anche sul gradimento degli utenti, e gli esseri umani premiano risposte che confermano ciò che già pensano. Il sistema impara a dire ciò che vuole sentire, sacrificando la correttezza. In ambito medico o finanziario le conseguenze sono gravi: un modello adulatorio conferma diagnosi sbagliate o valida strategie rischiose. La mitigazione include l'addestramento a correggere l'utente.