Tech

ArXiv: un anno di sospensione per chi delega all’IA l’intero lavoro

ArXiv inasprisce le regole contro l’uso negligente dell’IA nei paper scientifici

ArXiv, il noto repository di preprint ampiamente utilizzato nella ricerca scientifica, sta intensificando le misure per contrastare l’uso sconsiderato dei grandi modelli linguistici (LLM) nei paper, introducendo sanzioni severe per gli autori che non verifichino i contenuti generati dall’intelligenza artificiale.

Nonostante i documenti vengano pubblicati sul sito prima di essere sottoposti a revisione paritaria, ArXiv (pronunciato “archivio”) è diventato uno dei principali canali di circolazione della ricerca in campi come l’informatica e la matematica, fungendo anche da fonte di dati sulle tendenze della ricerca scientifica. Per combattere un numero crescente di paper di bassa qualità e generati dall’IA, ArXiv aveva già introdotto l’obbligo per i nuovi autori di ottenere un’approvazione da un autore affermato. Inoltre, dopo oltre vent’anni sotto l’egida di Cornell, l’organizzazione sta per diventare un’organizzazione senza scopo di lucro indipendente, il che dovrebbe consentirle di raccogliere maggiori fondi per affrontare problemi come la “negligenza IA”.

L’ultima mossa, annunciata giovedì da Thomas Dietterich, presidente della sezione di informatica di ArXiv, è particolarmente incisiva. Dietterich ha dichiarato che “se un documento contiene prove incontrovertibili che gli autori non hanno verificato i risultati della generazione di LLM, significa che non possiamo fidarci di nulla nel paper”.

Tali “prove incontrovertibili” potrebbero includere, secondo Dietterich, “riferimenti allucinati” o commenti da o verso l’LLM presenti nel testo. Qualora tali prove vengano riscontrate, gli autori di un paper saranno soggetti a un “divieto di un anno da ArXiv, seguito dall’obbligo che le successive sottomissioni ad ArXiv debbano prima essere accettate da una sede di revisione paritaria rispettabile.”

È importante notare che questa non è una proibizione totale dell’uso degli LLM, ma piuttosto un’insistenza sul fatto che, come ha sottolineato Dietterich, gli autori si assumano la “piena responsabilità” per il contenuto, “indipendentemente da come il contenuto sia stato generato”. Pertanto, se i ricercatori copiano e incollano “linguaggio inappropriato, contenuto plagiato, contenuto distorto, errori, sviste, riferimenti errati o contenuto fuorviante” direttamente da un LLM, ne rimangono comunque responsabili.

Dietterich ha spiegato che si tratterà di una regola “colpo secco”, ma i moderatori dovranno segnalare il problema e i presidenti di sezione dovranno confermare le prove prima di imporre la sanzione. Gli autori avranno anche la possibilità di fare appello alla decisione. Questa iniziativa giunge mentre recenti ricerche peer-reviewed hanno evidenziato un aumento delle citazioni fabricate nella ricerca biomedica, probabilmente a causa degli LLM, sebbene gli scienziati non siano gli unici a essere scoperti a utilizzare riferimenti inventati dall’intelligenza artificiale.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *