Vai al contenuto principale

Google I/O 2026: l’inizio dell’era agentica di Gemini

Da Gemini 3.5 Flash e Gemini Omni ad Antigravity 2.0 e Gemini Spark: ecco cosa conta davvero dal keynote di Google I/O 2026 incentrato sugli agenti.
Aggiornato 20 mag 2026  · 12 min leggi

Il filo conduttore di quasi tutti gli annunci del primo giorno di Google I/O 2026 è stato lo stesso: gli agenti. Non chatbot, non assistenti, ma agenti persistenti, esecutori di task, che girano in background e si integrano nell’intero stack di prodotti Google. Il CEO Sundar Pichai l’ha definita esplicitamente l’“era agentica di Gemini”, e gli annunci hanno confermato questa impostazione.

Google ha anche risposto agli abbonamenti Claude Max di Anthropic e ChatGPT Pro di OpenAI introducendo un nuovo livello Google AI Ultra a I/O, con lo stesso prezzo di $100/mese e che limita l’accesso ad alcune delle funzionalità agentiche descritte qui sotto.

In questo articolo ti accompagno tra gli annunci più rilevanti per chi lavora con l’AI e per gli sviluppatori. Mi concentro sugli aggiornamenti disponibili ora o in arrivo a breve.

Gemini 3.5 Flash

Gemini 3.5 Flash è il modello di punta annunciato a I/O 2026. Supera Gemini 3.1 Pro nei benchmark agentici e di coding, mentre Google afferma che genera token in output 4 volte più velocemente al secondo rispetto ad altri modelli d’avanguardia. Non possiamo ancora confermarlo, ma è certamente un’affermazione audace.

Guardando i benchmark, il salto prestazionale si vede, soprattutto in MCP Atlas, CharXiV Reasoning e Finance Agent v2, dove Gemini 3.5 Flash è in testa. Nel complesso, 3.5 Flash sembra competitivo con Claude Opus 4.7 e GPT-5.5.

Benchmark

3.5 Flash

3 Flash

3.1 Pro

Claude Sonnet 4.6

Opus 4.7

GPT-5.5

Terminal-bench 2.1

76,2%

58,0%

70,3%

--

66,1%

78,2%

SWE-Bench Pro

55,1%

49,6%

54,2%

--

64,3%

58,6%

MCP Atlas

83,6%

62,0%

78,2%

69,5%

79,1%

75,3%

OSWorld

78,4%

65,1%

76,2%

72,5%

78,0%

78,7%

Finance Agent v2

57,9%

42,6%

43,0%

51,0%

51,5%

51,8%

CharXiv Reasoning

84,2%

80,3%

83,3%

72,4%

82,1%

84,1%

Humanity's Last Exam

40,2%

33,7%

44,4%

33,2%

46,9%

41,4%

ARC-AGI-2

72,1%

33,6%

77,1%

58,3%

75,8%

84,6%

Interessante anche il profilo dei costi. Google sostiene che le aziende che processano circa 1 trilione di token al giorno potrebbero risparmiare oltre 1 miliardo di dollari all’anno spostando l’80% dei carichi da altri modelli d’avanguardia a 3.5 Flash. È un messaggio diretto ai clienti enterprise di OpenAI e Anthropic. Gemini 3.5 Flash è disponibile da oggi tramite Gemini API, Google AI Studio e l’app Gemini. Gemini 3.5 Pro è già in uso interno e atteso il mese prossimo.

Per ulteriori dettagli, ti consiglio di leggere il nostro articolo su Gemini 3.5 Flash, dove approfondiamo il nuovo modello.

Gemini Omni

Gemini Omni è il nuovo modello generativo multimediale nativamente multimodale di Google, in grado di accettare qualsiasi combinazione di testo, immagini, audio e video come input e produrre output video. Il primo modello della famiglia, Gemini Omni Flash, è disponibile oggi nell’app Gemini, in Google Flow e in YouTube Shorts.

Il punto architetturale chiave è che Omni unifica ciò che prima era uno stack separato (Veo per il video, Imagen per le immagini, sistemi audio separati) in un unico modello. Ciò significa modifiche più coerenti e meno artefatti di pipeline quando si lavora tra modalità diverse. Google non ha pubblicato benchmark numerici per Omni al lancio, quindi la valutazione indipendente è ancora in corso. L’accesso API per sviluppatori e clienti enterprise arriverà nelle settimane successive a I/O.

Lo abbiamo testato e raccontato nel dettaglio nel nostro articolo su Gemini Omni. I primi risultati di generazione video sono stati altalenanti (almeno rispetto agli standard elevati fissati da strumenti come Seedance 2.0), ma una versione più potente, Gemini Omni Pro, è attesa a breve.

Antigravity 2.0

Antigravity è la piattaforma di sviluppo di Google pensata innanzitutto per gli agenti, e la versione 2.0 presentata a I/O è un’espansione significativa. In precedenza posizionata come ambiente di coding, ora è una piattaforma completa per sviluppare, distribuire e gestire coorti di agenti AI autonomi. Il fulcro è una nuova applicazione desktop standalone che funge da hub centrale per l’orchestrazione degli agenti, permettendoti di eseguirne più di uno in parallelo su task differenti simultaneamente.

L’ecosistema ora offre quattro superfici distinte per gli sviluppatori:

  • App desktop Antigravity 2.0: orchestra più agenti in parallelo e supporta task pianificati in background. Si integra con Google AI Studio, Android e Firebase.
  • Antigravity CLI: un’interfaccia nativa da terminale per creare ed eseguire agenti senza GUI. Google chiede agli utenti di Gemini CLI di migrare qui.
  • Antigravity SDK: accesso programmatico allo stesso “harness” per agenti che alimenta i prodotti Google, con supporto per comportamenti personalizzati ospitati sulla tua infrastruttura.
  • Antigravity nel Gemini Enterprise Agent Platform: collega Antigravity direttamente ai progetti Google Cloud per carichi enterprise.

Arrivano anche un paio di nuove funzioni molto utili per l’agente core. La principale: ora può generare al volo subagent modulari, ciascuno in esecuzione in parallelo con isolamento del workspace ed eredità delle configurazioni degli strumenti e dei permessi del “genitore”. Le operazioni di lunga durata girano in modo asincrono, quindi non bloccano più il loop dell’agente.

In modo simile ai Claude Code Hooks, i JSON Hooks consentono di agganciare script shell personalizzati in fasi chiave dell’esecuzione (prima/dopo le chiamate agli strumenti, le chiamate al modello o ai punti di arresto) per logging, personalizzazione degli argomenti o iniezione di istruzioni. Le Attività pianificate permettono di impostare prompt basati su cron per esecuzioni periodiche dell’agente, come riepiloghi PR giornalieri o controlli di deploy orari, con i risultati che appaiono nella sidebar per un passaggio di consegne fluido alla supervisione umana.

Sul fronte della gestione, Antigravity introduce i “progetti” come primitive organizzative che definiscono impostazioni, risorse e permessi per gruppo di agenti, invece di richiedere i permessi globali più ampi per tutto. Il pannello laterale rinnovato supporta il raggruppamento delle conversazioni per progetto, stato o recentità, con supporto nativo ai Git worktree integrato. Questo layout basato sui progetti è paragonabile alla gestione multi-finestra di Cursor e alla task queue di Codex, ma con uno scoping dei permessi per progetto più rigoroso.

I worktree Git nativi possono essere creati facilmente all’avvio di una nuova conversazione.

Input vocale tramite i modelli Gemini Audio e nuovi slash command (/goal per esecuzioni autonome, /grill-me per chiarimenti pre-task, /schedule per prompt cron, /browser per l’uso del browser su opt-in) completano l’esperienza.

Antigravity 2.0 è disponibile da oggi per gli utenti. Il piano Google AI Ultra ($100/mese) include un limite di utilizzo 5 volte superiore in Antigravity rispetto al piano Google AI Pro.

Managed Agents nella Gemini API

Insieme ad Antigravity 2.0, Google ha annunciato i Managed Agents nella Gemini API, che portano funzionalità agentiche direttamente a livello di API per gli sviluppatori che vogliono creare applicazioni basate su agenti senza dover gestire l’infrastruttura di orchestrazione. È il complemento a livello API dell’esperienza desktop di Antigravity.

Implica, in pratica, che ora puoi definire comportamenti degli agenti, integrazioni di strumenti e workflow multi-step tramite la Gemini API, lasciando che l’infrastruttura di Google gestisca l’esecuzione. Questo ha il potenziale per cambiare davvero le carte in tavola per i team che costruiscono applicazioni di produzione con esecuzione di task a lungo raggio senza dover allestire e gestire un proprio “harness” di agenti. L’accesso è disponibile tramite Google AI Studio, e i clienti enterprise possono raggiungerlo tramite il Gemini Enterprise Agent Platform.

Una nota onesta: i primi feedback degli sviluppatori dalla copertura di I/O segnalano che la documentazione per i flussi agentici complessi e la gestione degli errori è ancora scarna. Anche i limiti di rate e la gestione delle quote sono indicati come punti di attrito. Sono entrambi aspetti che probabilmente miglioreranno col tempo, ma vale la pena saperlo prima di impegnarsi su questo stack.

Gemini Spark

Gemini Spark (da non confondere con l’LLM più recente di Meta, Muse Spark) è il nuovo agente AI personale di Google, ed è l’annuncio agentico più orientato ai consumer. Funziona 24/7 su macchine virtuali dedicate in Google Cloud, il che significa che non serve tenere il laptop acceso perché continui a lavorare. Spark è alimentato da Gemini 3.5 e dall’harness di Antigravity, che gli consente di gestire in background task di lunga durata.

Le funzionalità al lancio includono:

  • Integrazione con gli strumenti Google (Workspace, Gmail, Calendar) al lancio, con supporto agli strumenti di terze parti via MCP nelle settimane successive.
  • Interazione attraverso l’app Gemini, e presto anche via email e chat.
  • Operatività direttamente in Chrome come layer di navigazione agentico, in arrivo più avanti quest’estate.
  • Avanzamento attività in tempo reale visibile tramite Android Halo, un nuovo spazio UI su Android, in arrivo più tardi quest’anno.

Vale il confronto diretto con l’ecosistema di agenti di OpenAI e le capacità di uso strumenti di Anthropic. Il fattore distintivo di Spark è l’esecuzione persistente 24/7 sull’infrastruttura Google Cloud, unita a una profonda integrazione nella suite di produttività Google. Se il tuo lavoro vive già in Google Workspace, è un vantaggio concreto. Altrimenti, la proposta di valore è meno evidente.

Qui la preoccupazione legittima è la privacy. Un agente che monitora continuamente inbox, calendario e documenti pone domande reali su residenza dei dati e compliance nei settori regolamentati. Una domanda che mi ponevo, per esempio, era: “Cosa succede alla memoria dell’agente quando un dipendente lascia l’azienda?” Google non ha ancora fornito risposte dettagliate.

Spark sta arrivando a tester fidati questa settimana, con una Beta per gli abbonati Google AI Ultra ($100/mese) negli USA la settimana successiva. Ne parliamo più in dettaglio nel nostro articolo su Gemini Spark.

Managed Agents vs Gemini Spark

Agent per la Ricerca e AI Mode

AI Mode in Search è stato introdotto al precedente I/O. A un anno di distanza, ha superato il miliardo di utenti attivi mensili. Ora Google spinge oltre con due nuove funzionalità agentiche.

La prima sono gli information agent in Search: agenti personalizzati in background che configuri per monitorare argomenti e far emergere le informazioni rilevanti al momento giusto. Arriveranno quest’estate, a partire dagli abbonati Google AI Pro e Ultra.

La seconda è la UI generativa in Search, alimentata da Gemini 3.5 Flash e Antigravity. Search ora costruirà layout personalizzati, visual interattivi e persino dashboard persistenti o mini-app per query complesse e di lunga durata. Le funzionalità di UI generativa arriveranno gratuitamente a tutti gli utenti quest’estate. Le dashboard persistenti e le app personalizzate saranno disponibili prima per gli abbonati Pro e Ultra negli USA.

Questo è un problema reale per editori e professionisti SEO (come già lo sono state le introduzioni di AI Overview e AI Mode). Quando le risposte generate dall’AI risolvono completamente la query dell’utente direttamente in Search, non c’è più motivo di cliccare sulla fonte. Lo abbiamo già visto: sia AI Overviews sia il rollout iniziale di AI Mode hanno portato a cali di traffico significativi nel settore. Google non ha ancora introdotto un modo chiaro per condividere i ricavi o garantire traffico agli editori i cui contenuti alimentano queste risposte.

Google Flow

Google Flow, presentato a I/O 2025 come strumento AI per filmmaking, compie un passo avanti importante con tre aggiornamenti chiave:

  • Agente di pianificazione più intelligente. L’agente aggiornato di Flow ora può pianificare e ragionare su progetti creativi multi-step. Gli fornisci gli input (ad esempio un concept, alcune immagini di riferimento, una bozza di script) e ti aiuta a passare dal brainstorming iniziale a creazione ed editing, tutto in un unico ambiente. Il nuovo agente è disponibile per tutti da oggi.
  • Video nativo tramite Gemini Omni. Flow ora gestisce la generazione e l’editing video in modo nativo tramite il modello Omni. Puoi descrivere in linguaggio naturale le modifiche a una clip del rullino e iterare in conversazione. È migliorata anche la coerenza dei personaggi, quindi identità e voce si mantengono tra le scene. Utile soprattutto se produci un cortometraggio o una campagna con personaggi ricorrenti.
  • Vibe coding per tool personalizzati. Invece di essere limitato agli strumenti forniti da Flow, ora puoi crearne di tuoi direttamente sulla piattaforma. Google ha mostrato esempi come progettare effetti video custom, creare strumenti per animazione a mano e costruire workflow di stratificazione del testo, il tutto senza uscire da Flow.

Nel loro insieme, questi aggiornamenti posizionano Flow come qualcosa di più di un assistente creativo. Sta diventando una piattaforma per costruire workflow creativi, con un’app mobile ora in beta su Android e in arrivo presto su iOS.

Espansione di SynthID

SynthID, il sistema invisibile di watermarking AI di Google, ha ora applicato watermark a oltre 100 miliardi di immagini e video e a 60.000 anni di asset audio dal suo lancio tre anni fa. L’annuncio di I/O più rilevante qui non è la scala, ma i partner: OpenAI, Kakao ed Eleven Labs stanno adottando SynthID insieme a Nvidia, che si era unita lo scorso anno.

L’adozione trasversale all’industria è ciò che lo rende significativo. Uno standard di watermarking funziona solo se è abbastanza diffuso perché “non watermarkato” diventi un segnale utile. Google sta anche estendendo la verifica dei Content Credentials (lo standard C2PA) a Search e Chrome, mostrando agli utenti se un contenuto proviene da AI o da una fotocamera e se è stato modificato con strumenti generativi. La combinazione di SynthID e C2PA fornisce due layer indipendenti di provenienza, l’approccio giusto dato quanto facilmente ciascuno dei due possa essere rimosso singolarmente.

Menzioni d’onore

Diversi altri annunci da I/O meritano una nota rapida:

  • Docs Live: una nuova funzione “voice-first” per Google Docs che ti permette di riversare idee a voce e farle strutturare a Gemini in un documento. Arriva per gli abbonati quest’estate, con funzionalità vocali in arrivo in Gmail e Keep nello stesso periodo.
  • Google Pics: un nuovo strumento AI per creazione e editing di immagini basato sul modello Nano Banana, che tratta ogni elemento come oggetto individuale invece che come immagine piatta. Disponibile ora ai tester fidati, in rollout per gli abbonati Google AI Pro e Ultra più avanti quest’estate.
  • Android Halo: un nuovo spazio UI su Android per vedere aggiornamenti live e avanzamento dei task degli agenti come Gemini Spark. In arrivo più tardi quest’anno.
  • Daily Brief: un agente “pronto all’uso” nell’app Gemini che compila un riepilogo mattutino personalizzato da inbox, calendario e attività, con prossimi step suggeriti. Nessun prezzo separato annunciato; previsto come parte dell’esperienza dell’app Gemini.
  • TPU 8t e 8i: le TPU di ottava generazione di Google adottano un approccio dual-chip, con 8t ottimizzato per il pretraining su larga scala (quasi 3x la potenza di calcolo grezza della generazione precedente, scalabile su oltre 1 milione di TPU globalmente) e 8i ottimizzato per l’inferenza. Entrambi offrono fino a 2x migliori prestazioni-per-watt rispetto alla generazione precedente.
  • Gemini for Science: una raccolta di strumenti AI che collega Antigravity a oltre 30 grandi database delle scienze della vita. Science Skills è disponibile oggi su GitHub e direttamente in Antigravity.

Considerazioni finali

Google I/O 2026 ha puntato sugli agenti come direzione primaria dell’AI, con Gemini 3.5 Flash e Antigravity 2.0 come infrastruttura alla base di quasi tutto il resto. Le cose che puoi usare subito sono Gemini 3.5 Flash (tramite Gemini API e AI Studio), il nuovo agente di Flow, Gemini Omni Flash e l’app desktop Antigravity 2.0. Gemini Spark, gli agent per la Ricerca e le funzionalità di UI generativa in Search verranno distribuiti durante l’estate, in gran parte dietro il nuovo livello AI Ultra da $100/mese (almeno inizialmente).

Per me, l’upgrade di Antigravity è stato la novità più interessante, perché opera su due livelli simultaneamente: come app per sviluppatori standalone, compete direttamente con Codex e Claude Code; come piattaforma, il suo ADK sottostante e la Managed Agents API sfidano framework di orchestrazione come LangChain, AutoGen e l’Agents SDK di OpenAI. L’integrazione con Gemini e il layer di deployment su Google Cloud sono i fattori distintivi (e il rischio di lock-in) su entrambi i fronti.

Google I/O 2026 - Domande frequenti

Come si confronta Gemini 3.5 Flash con GPT-5.5 e Claude Opus 4.7?

Gemini 3.5 Flash è in testa su diversi benchmark agentici come MCP Atlas (83,6%) e Finance Agent v2 (57,9%), mentre GPT-5.5 prevale su SWE-Bench Pro e ARC-AGI-2. Claude Opus 4.7 resta il più forte su Humanity's Last Exam (46,9%). La sintesi è che è competitivo con i modelli di frontiera pur girando più velocemente e a costi sensibilmente inferiori su larga scala, come suggerisce il nome. Una variante Pro più potente è attesa a breve.

In cosa Google Antigravity è diverso da Claude Code o Codex?

Google Antigravity 2.0 è una piattaforma di sviluppo agent-first che ti permette di orchestrare più agenti AI in parallelo tramite app desktop, CLI, SDK e API enterprise. A differenza di Claude Code (un agente di coding nativo da terminale) o Codex (un sistema basato su task queue), Antigravity offre uno scoping dei permessi più rigoroso per progetto, generazione di subagent e integrazione diretta con Google Cloud e Firebase. Il suo duplice ruolo di strumento per sviluppatori e piattaforma SDK lo rende più paragonabile a un framework di orchestrazione che a un semplice assistente di coding.

Il piano Google AI Ultra da $100/mese vale la pena rispetto a ChatGPT Pro o Claude Max?

Tutti e tre i piani costano $100/mese, ma il valore dipende dal tuo ecosistema. Il tratto distintivo di Google AI Ultra è l’accesso a Gemini Spark (un agente persistente 24/7), limiti di utilizzo 5x più alti in Antigravity e una profonda integrazione con Google Workspace. Se il tuo flusso di lavoro vive già in Gmail, Docs e Calendar, Ultra ha un vantaggio naturale. Se invece ti serve principalmente assistenza al coding o flessibilità a livello di API, ChatGPT Pro o Claude Max potrebbero servirti meglio.

Cos’è Gemini Omni e come gestisce la generazione video?

Gemini Omni è il modello nativamente multimodale di Google che accetta qualsiasi combinazione di testo, immagini, audio e video come input e produce output video. Unifica sistemi prima separati (Veo per il video, Imagen per le immagini) in un unico modello, il che dovrebbe portare a modifiche cross-modali più coerenti. La prima versione, Omni Flash, è disponibile ora, con un Omni Pro più capace atteso a breve. Non sono ancora stati pubblicati benchmark indipendenti, quindi la qualità nel mondo reale è ancora in valutazione.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom è un data scientist e formatore tecnico. Scrive e gestisce i tutorial e i post del blog di DataCamp su data science. In precedenza, Tom ha lavorato nella data science presso Deutsche Telekom.

Argomenti

Scopri l’ecosistema AI di Google

Programma

Google Workspace with Gemini

4 h
You learn about the key features of Gemini and how they can be used to improve productivity and efficiency in Google Workspace.
Vedi dettagliRight Arrow
Inizia il corso
Mostra altroRight Arrow
Correlato

blog

I 15 migliori server MCP remoti che ogni AI builder dovrebbe conoscere nel 2026

Scopri i 15 migliori server MCP remoti che stanno trasformando lo sviluppo AI nel 2026. Scopri come migliorano automazione, ragionamento, sicurezza e velocità dei workflow.
Abid Ali Awan's photo

Abid Ali Awan

15 min

blog

Tokenizzazione nel NLP: come funziona, sfide e casi d'uso

Guida al preprocessing NLP nel machine learning. Copriamo spaCy, i transformer di Hugging Face e come funziona la tokenizzazione in casi d'uso reali.
Abid Ali Awan's photo

Abid Ali Awan

10 min

blog

Che cos'è Snowflake? Guida per principianti alla piattaforma dati cloud

Esplora le basi di Snowflake, la piattaforma dati cloud. Scopri la sua architettura, le sue funzionalità e come integrarla nelle tue pipeline di dati.
Tim Lu's photo

Tim Lu

12 min

Mostra altroMostra altro