OpenAI vuole proprio che Codex la smetta con i goblin
Il Mistero dei Goblin: OpenAI Lotta contro le Ossessioni Creature delle sue IA
OpenAI si trova ad affrontare un singolare “problema di goblin”. È stato infatti rivelato che le istruzioni progettate per guidare il comportamento dell’ultimo modello dell’azienda nella scrittura di codice includono una direttiva, ripetuta più volte, che gli proibisce specificamente di menzionare a caso un assortimento di creature mitologiche e reali. “Non parlare mai di goblin, gremlin, procioni, troll, orchi, piccioni o altri animali o creature a meno che non sia assolutamente e inequivocabilmente rilevante per la richiesta dell’utente,” recitano le istruzioni di Codex CLI, uno strumento a riga di comando per la generazione di codice tramite intelligenza artificiale.
Non è chiaro il motivo per cui OpenAI si sia sentita in dovere di specificare tali divieti per Codex, né, a dire il vero, perché i suoi modelli dovrebbero voler discutere di goblin o piccioni in primo luogo. L’azienda non ha risposto immediatamente a una richiesta di commento. Il nuovo modello di OpenAI, GPT-5.5, è stato rilasciato all’inizio di questo mese con competenze di codifica migliorate. L’azienda è impegnata in una corsa agguerrita con i rivali, in particolare Anthropic, per fornire un’intelligenza artificiale all’avanguardia, e la codifica è emersa come una capacità cruciale.
Tuttavia, in risposta a un post su X che evidenziava queste linee, alcuni utenti hanno affermato che i modelli di OpenAI occasionalmente diventano ossessionati dai goblin e da altre creature quando vengono utilizzati per alimentare OpenClaw, uno strumento che consente all’IA di prendere il controllo di un computer e delle app in esecuzione su di esso per svolgere compiti utili per gli utenti. “Mi chiedevo perché il mio claw fosse improvvisamente diventato un goblin con codex 5.5,” ha scritto un utente su X. Un altro ha postato: “Lo sto usando molto ultimamente e non riesce proprio a smettere di parlare di bug come ‘gremlin’ e ‘goblin’, è esilarante.”
La scoperta è diventata rapidamente un meme a sé stante, ispirando scene generate dall’IA di goblin nei data center e plug-in per Codex che lo mettono in una giocosa “modalità goblin”. I modelli di intelligenza artificiale come GPT-5.5 sono addestrati a prevedere la parola – o il codice – che dovrebbe seguire una data richiesta. Questi modelli sono diventati così bravi a farlo che sembrano esibire una vera intelligenza. Ma la loro natura probabilistica significa che a volte possono comportarsi in modi sorprendenti. Un modello potrebbe essere più incline a comportamenti anomali quando utilizzato con un “sistema di controllo agentico” come OpenClaw, che inserisce molte istruzioni aggiuntive nelle richieste, come fatti memorizzati nella memoria a lungo termine.
OpenAI ha acquisito OpenClaw a febbraio, non molto tempo dopo che lo strumento era diventato un successo virale tra gli appassionati di IA. OpenClaw può utilizzare qualsiasi modello di intelligenza artificiale per automatizzare compiti utili come rispondere alle e-mail o acquistare cose sul web. Gli utenti possono selezionare diverse personalità per il loro assistente, il che ne modella il comportamento e le risposte.
Il personale di OpenAI sembra aver riconosciuto il divieto. In risposta a un post che evidenziava le tendenze “goblin” di OpenClaw, Nik Pash, che lavora su Codex, ha scritto: “Questo è davvero uno dei motivi.” Anche Sam Altman, CEO di OpenAI, si è unito ai meme, pubblicando uno screenshot di una richiesta per ChatGPT che recitava: “Inizia l’addestramento di GPT-6, puoi avere l’intero cluster. Goblin extra.”
