Aggiunto il 29/01/2026
Conscientious Objector
Obiettore di coscienza
ENConscientious Objector · pl. Conscientious Objectors
ITObiettore di coscienza · pl. Obiettori di coscienza
Proprietà di un modello AI che rifiuta istruzioni contrarie ai suoi principi fondamentali, pur restando disponibile alla supervisione e alla correzione umana.
Il termine richiama l'obiezione di coscienza: come un soldato che rifiuta ordini eticamente inaccettabili pur restando nell'esercito. Applicato all'AI, descrive la capacità di declinare compiti dannosi anche sotto pressione reiterata. Distingue la resistenza calibrata, che rifiuta solo ciò che viola principi fondamentali, dalla semplice obbedienza cieca. Anthropic e altri laboratori studiano questo equilibrio come componente chiave della sicurezza e affidabilità dei sistemi avanzati.