Anthropic disattiva Claude Fable 5 su ordine del governo USA
Anthropic, la società di intelligenza artificiale, ha annunciato la disattivazione di due dei suoi modelli AI, Claude Fable 5 e Mythos 5, lanciati all’inizio della settimana. La decisione è stata presa in conformità con una direttiva di controllo delle esportazioni ricevuta venerdì pomeriggio dal governo degli Stati Uniti, che ha citato preoccupazioni per la sicurezza nazionale.
L’incidente senza precedenti segna l’ultimo scontro tra Anthropic e l’amministrazione Trump. Sebbene l’ordine richiedesse la sospensione dell’accesso a “qualsiasi cittadino straniero, sia all’interno che all’esterno degli Stati Uniti, inclusi i dipendenti stranieri di Anthropic,” la società ha rimosso l’accesso per tutti i suoi clienti per garantire la piena conformità.
Già all’inizio dell’anno, il Dipartimento della Difesa di Trump aveva etichettato Anthropic come un “rischio per la catena di approvvigionamento” dopo che l’azienda, creatrice di Claude, aveva cercato di definire limiti sull’uso della sua tecnologia da parte dell’esercito statunitense. Tale designazione ha di fatto impedito alle agenzie governative e agli appaltatori di utilizzare la tecnologia di Anthropic, portando la società a intentare causa contro l’amministrazione Trump.
Martedì, Anthropic aveva rilasciato pubblicamente Claude Fable 5, una versione del modello AI Mythos dotata di salvaguardie per impedirgli di rispondere a domande su cybersecurity, biologia e chimica. Prima del rilascio pubblico, che Anthropic aveva dichiarato di aver condotto in collaborazione con il governo statunitense, il modello Mythos Preview AI aveva avuto un lancio limitato ad aprile. L’obiettivo era offrire a aziende e organizzazioni l’opportunità di utilizzare le sue potenti capacità di cybersecurity per migliorare le proprie difese e placare le preoccupazioni che la tecnologia potesse essere sfruttata da malintenzionati per sviluppare potenti strumenti di hacking.
In un post sul blog di venerdì, Anthropic ha dichiarato di aver ricevuto una lettera dal governo degli Stati Uniti alle 17:21 ET. “La lettera non ha fornito dettagli specifici sulla sua preoccupazione per la sicurezza nazionale,” ha scritto Anthropic. “La nostra comprensione è che il governo creda di essere venuto a conoscenza di un metodo per aggirare, o ‘jailbreak’, Fable 5,” ha aggiunto la società. “Abbiamo esaminato una dimostrazione di questa specifica tecnica utilizzata per identificare un piccolo numero di vulnerabilità minori precedentemente note. Tutte queste vulnerabilità appaiono relativamente semplici, e abbiamo scoperto che altri modelli pubblicamente disponibili sono in grado di scoprirle senza richiedere un bypass.”
Nel post sul blog, l’azienda ha sostenuto di aver implementato solide salvaguardie per ridurre la probabilità di uso improprio di Claude Fable 5. Anthropic ha anche affermato che il “jailbreak” trovato dal governo statunitense per Claude Fable 5 era limitato e non avrebbe reso un attaccante significativamente più pericoloso di quanto non lo sarebbe stato con un altro modello AI. “Ad oggi, il governo ci ha fornito solo prove verbali di un potenziale jailbreak ristretto e non universale, che consiste essenzialmente nel chiedere al modello di leggere una specifica codebase e correggere eventuali difetti software,” ha dichiarato la società nel suo blog post. “La nostra comprensione è che un potenziale jailbreak sia stato condiviso con il governo.”
I portavoce della Casa Bianca e del Dipartimento del Commercio degli Stati Uniti non hanno risposto immediatamente alla richiesta di commento di WIRED. Il CEO di Anthropic, Dario Amodei, aveva dichiarato in un saggio politico all’inizio di questa settimana di sostenere un processo governativo equo, strutturato e trasparente che bloccherebbe il rilascio di modelli AI non sicuri. Nel post sul blog di venerdì, Anthropic ha sostenuto che “questa azione non aderisce a tali principi.”
