Internet si sta ricostruendo per le macchine
Le infrastrutture cloud, a lungo progettate per l’interazione umana, si trovano di fronte a una sfida inedita posta dagli agenti di intelligenza artificiale. Questi ultimi, a differenza degli utenti umani con i loro schemi prevedibili di clic e scroll, generano un’ondata di attività rapida e intensa, lanciando sotto-agenti che interrogano centinaia di database, cercano documenti e chiamano API in pochi secondi, per poi svanire con la stessa velocità con cui sono apparsi. In risposta a questa nuova realtà, Amazon sta profondamente ripensando un componente chiave della sua infrastruttura cloud.
Giovedì, AWS ha lanciato la sua prossima generazione di OpenSearch Serverless, un database di ricerca e vettoriale completamente gestito, ideato specificamente per carichi di lavoro “agentici”. Il nuovo sistema, spiega AWS, è in grado di scalare istantaneamente verso l’alto quando gli agenti attivano i loro compiti e di ridursi fino a zero quando sono inattivi, ottimizzando così i costi e le risorse.
Questo lancio evidenzia una crescente consapevolezza nel settore tecnologico: l’infrastruttura originariamente concepita per un internet guidato dall’uomo non è più adeguata in un mondo sempre più popolato da agenti intelligenti. Sebbene gli agenti AI rappresentino ancora una frazione relativamente piccola dell’attività online, il traffico generato dalle macchine è già significativo e destinato a un’espansione esponenziale.
Cloudflare rivela che i bot hanno rappresentato il 31% del traffico HTTP complessivo negli ultimi sei mesi, con crawler AI, motori di ricerca e assistenti che hanno costituito circa un quarto di tutte le richieste bot in quel periodo. Li Yi Ohlsen, senior product manager di Cloudflare, ha dichiarato a TechCrunch che “il traffico non umano supererà il traffico umano entro la prima metà del 2027”.
Al Google I/O, la conferenza per sviluppatori tenutasi la scorsa settimana, l’azienda ha annunciato che gli utenti potranno delegare compiti ai sistemi AI, come la ricerca di acquisti, la prenotazione di viaggi, la navigazione web e l’interazione con le app. Ma la rivoluzione non si ferma agli agenti AI consumer: le aziende stanno sempre più implementando agenti internamente e per i loro clienti, generando nuovi tipi di traffico macchina-macchina “dietro le quinte”.
Di conseguenza, i fornitori di servizi cloud e le aziende di infrastrutture si stanno confrontando su come adattare sistemi pensati per gli esseri umani a un mondo di agenti che recuperano informazioni, invocano strumenti e generano traffico macchina-macchina in modo costante e autonomo. Ed è qui che interviene il nuovo OpenSearch Serverless di AWS.
“Il tempismo è semplice. Gli agenti stanno passando dalla sperimentazione alla produzione, e creano modelli di traffico per i quali le infrastrutture precedenti semplicemente non erano state progettate,” ha spiegato a TechCrunch Tia White, general manager per Amazon OpenSearch Service. “Essi registrano picchi senza preavviso, vanno inattivi senza notifica, e le aziende hanno bisogno di una ricerca che tenga il passo senza pagare per risorse di calcolo vuote o inattive.”
La principale innovazione tecnica di questa nuova generazione è il disaccoppiamento del calcolo (compute) dall’archiviazione (storage). Questo permette al “compute” di scalare in pochi secondi per gestire i picchi di traffico degli agenti e di ridursi fino a zero, garantendo che i clienti non paghino nulla quando gli agenti sono inattivi.
“Precedentemente, anche nella nostra versione Serverless precedente, era necessario avere almeno un’istanza operativa e in esecuzione perché archiviazione e calcolo erano accoppiati,” ha detto White. “Non era possibile scalare automaticamente alla velocità necessaria, quindi si aveva sempre una risorsa di calcolo inattiva riservata per il proprio carico di lavoro, che la si usasse o meno.” Questo era come pagare sempre per un parcheggio, anche quando non lo si usa; con l’OpenSearch Serverless aggiornato di AWS, è più simile a pagare per un parcheggio a ore.
Al momento del lancio, OpenSearch Serverless si integrerà nativamente con piattaforme di sviluppo AI come Vercel e Kiro, consentendo agli sviluppatori di implementare backend di ricerca e vettoriali pronti per la produzione destinati agli agenti senza la necessità di gestire l’infrastruttura sottostante.
Questo cambiamento non è isolato e si sta diffondendo in tutto il settore cloud. Databricks e Snowflake si stanno riposizionando come sistemi di memoria e recupero AI per i dati aziendali. Microsoft ha implementato aggiornamenti ad Azure per gestire i picchi degli agenti AI e condividere la memoria tra di essi. Cloudflare, in una mossa simile a quella di Amazon, il mese scorso ha introdotto un’infrastruttura volta a fornire ambienti persistenti e scalabilità istantanea agli agenti.
Maggiore sarà il numero di aziende che implementeranno agenti AI, maggiore sarà la pressione per riprogettare l’infrastruttura attorno ai carichi di lavoro generati dalle macchine, il che, a sua volta, potrebbe rendere gli agenti più economici e facili da implementare su scale più ampie.
