Google prepara Gemini Omni, il modello AI che può cambiare i video generati con Gemini
Google prepara Gemini Omni, un modello AI pensato per creare, modificare e remixare video dentro Gemini con comandi semplici. Il possibile lancio potrebbe rendere i video generati dall’Intelligenza Artificiale più realistici, accessibili e integrati nell’ecosistema Google.
Google sembra pronta a fare un nuovo passo nel mondo dei video creati con l’Intelligenza Artificiale, infatti il nome comparso nelle ultime ore è Gemini Omni, indicato da alcune indiscrezioni anche come Gemini “Omnia”. Al momento non c’è ancora un annuncio ufficiale, ma diversi segnali emersi nell’interfaccia di Gemini fanno pensare a un lancio vicino, dove la finestra più probabile resta quella del Google I/O 2026, l’evento in cui Big G presenta spesso le novità più importanti legate all’AI. Gemini Omni potrebbe quindi diventare il nuovo motore video della piattaforma, affiancando o superando l’attuale famiglia Veo.
La notizia nasce da una dicitura comparsa nella sezione dedicata alla creazione video di Gemini, dove alcune schermate hanno mostrato un riferimento a “Crea con Gemini Omni” o a un sistema “Powered by Omni”. Non si tratterebbe quindi di un progetto lontano, ma di qualcosa già testato dentro un ambiente molto vicino al prodotto finale. Il nuovo modello AI per i video sembra pensato per semplificare la creazione e la modifica e dei filmati direttamente da Gemini.
Perché Omni può essere diverso da Veo e modificare i video parlando con l’AI
Oggi Google ha già una tecnologia video molto evoluta, cioè Veo 3.1, con la pagina ufficiale di Gemini che spiega che Veo permette di creare video brevi con audio, partendo da testo o immagini di riferimento. Il sistema supporta anche contenuti verticali e può usare più immagini per mantenere personaggi, oggetti e stile coerenti nella scena, Omni però sembra voler andare oltre questa logica. Secondo le indiscrezioni, la differenza potrebbe essere l’unificazione tra testo, immagini e video in un solo modello, invece di strumenti separati per compiti diversi.
La caratteristica più promettente di Gemini Omni non riguarda solo la generazione da zero, ma il vero salto potrebbe arrivare dall’editing conversazionale, cioè dalla possibilità di cambiare un filmato con istruzioni scritte in linguaggio naturale. In pratica, si potrebbe chiedere a Gemini di rimuovere un elemento, sostituire un oggetto, cambiare atmosfera o applicare un modello predefinito. Questo renderebbe il processo molto più vicino a una chat che a un software di montaggio tradizionale e l’editing video direttamente in chat sarebbe la funzione capace di rendere Omni più accessibile anche a chi non usa programmi professionali.
Video più realistici ma non ancora senza limiti
I primi demo citati dalla stampa specializzata mostrano due casi piuttosto utili per capire la direzione presa da Google. Il primo riguarda un professore che scrive una dimostrazione matematica alla lavagna, spiegando i passaggi, dove la resa del testo scritto appare molto più convincente rispetto a tanti sistemi video precedenti, dove lettere e parole tendevano a deformarsi. Il secondo esempio riprende il famoso test degli spaghetti con Will Smith, spesso usato come prova informale per valutare i progressi dei generatori video. La gestione di mani, cibo, movimento e scritte sembra essere uno dei terreni su cui Omni vuole mostrare il salto qualitativo.
Il realismo è il punto che farà più discutere, in quanto negli ultimi mesi i filmati creati con Veo hanno già dimostrato quanto sia diventato difficile distinguere un video generato dall’ Intelligenza Artificiale da una ripresa reale. Il realismo dei video AI resta quindi una grande opportunità, ma anche una questione delicata per informazione, social e creatività digitale.
Il tema della trasparenza resta centrale
Più i video diventano credibili, più diventa importante capire da dove arrivano. Google ha già integrato nei contenuti generati con Veo una filigrana digitale chiamata SynthID. Si tratta di un sistema pensato per indicare che un contenuto è stato creato con strumenti AI. MediaWorld ha spiegato anche che Gemini può aiutare a riconoscere se un video contiene tracce di generazione artificiale legate agli strumenti Google. La trasparenza dei contenuti AI sarà quindi una parte essenziale della partita, soprattutto se Omni renderà la creazione video ancora più semplice e immediata.
Una sfida aperta con il resto del mercato AI
Un modello come Gemini Omni non interessa solo creator, social media manager o videomaker. Può avere ricadute anche nel racconto dei prodotti tecnologici e degli elettrodomestici. Un marchio potrebbe generare brevi dimostrazioni d’uso, tutorial, scene domestiche o clip promozionali senza passare da produzioni complesse. Un aspirapolvere robot, una friggitrice ad aria o una smart TV potrebbero essere spiegati con video brevi, chiari e personalizzati, tanto per fare un esempio concreto.
Il lancio di Omni, se confermato, arriverebbe in una fase molto competitiva. Google ha già portato Veo dentro Gemini e continua ad aggiornare il proprio ecosistema con strumenti per immagini, musica, ricerca e produttività. Altri protagonisti del settore stanno spingendo sui video generativi, perché questo formato è quello che colpisce di più il pubblico. La differenza la farà la qualità, ma anche la facilità d’uso. Gemini Omni sembra voler puntare proprio su questo equilibrio, mettendo insieme potenza creativa e comandi semplici da inserire.
