Skip to main content

Google sta implementando una significativa evoluzione della sua architettura di ricerca, passando da un motore di information retrieval tradizionale a un sistema di ragionamento e azione multimodale. Le recenti integrazioni per gli utenti dei piani premium statunitensi, basate sul modello Gemini 2.5 Pro, introducono un motore di query profondo e un framework agentico capace di eseguire task nel mondo reale, ridefinendo il paradigma operativo del search engine.

Integrazione di Gemini 2.5 Pro per la Decomposizione di Query Complesse

Il fulcro dell’aggiornamento è l’integrazione del Large Language Model (LLM) Gemini 2.5 Pro, accessibile tramite un’interfaccia sperimentale denominata “AI Mode”. A differenza dei precedenti modelli, Gemini 2.5 Pro è progettato per gestire query che richiedono un ragionamento multi-step e una decomposizione complessa del problema. Il modello è in grado di:

  • Eseguire task computazionali: Risolvere problemi matematici e logici che richiedono calcoli intermedi.
  • Interpretare e generare codice: Affrontare prompt legati alla programmazione, fornendo snippet di codice funzionali.
  • Generare risposte sintetizzate con citazioni: Le risposte non sono semplici estrazioni di testo, ma output sintetizzati corredati da un grafo di riferimenti, un approccio simile alla Retrieval-Augmented Generation (RAG) che mitiga il rischio di allucinazioni e garantisce la tracciabilità delle fonti.

Questo trasforma la ricerca da un processo di keyword matching e ranking a un’interfaccia conversazionale capace di problem-solving articolato.

Deep Search: Un Motore di Query Federata e Sintesi

Parallelamente, Google introduce Deep Search, un’architettura di ricerca avanzata progettata per prompt aperti o ambigui che non possono essere soddisfatti da una singola query. Il suo funzionamento si basa su:

  • Esecuzione di query parallelizzate: Il sistema lancia centinaia di query esplorative simultaneamente per mappare un dominio di conoscenza più ampio.
  • Integrazione di fonti eterogenee: Deep Search è in grado di aggregare e correlare dati provenienti da fonti non strutturate (testo web), semi-strutturate (tabelle, liste) e strutturate (Knowledge Graph).
  • Sintesi e reporting: L’output non è una lista di link (SERP), ma un report analitico strutturato che presenta una sintesi delle informazioni raccolte, evidenziando connessioni e fornendo fonti verificate.

Questo strumento è ottimizzato per task di analisi complessa, come ricerche di mercato, pianificazione finanziaria o revisioni accademiche, riducendo il carico cognitivo e la data aggregation manuale da parte dell’utente.

Framework Agentico per l’Esecuzione di Task nel Mondo Reale

L’innovazione più dirompente è l’introduzione di capacità agentiche, con cui l’AI esegue autonomamente azioni per conto dell’utente. La funzione di chiamata automatica è un’evoluzione diretta della tecnologia Google Duplex e si basa su uno stack tecnologico complesso:

  • Natural Language Understanding (NLU): Per il parsing dell’input utente e l’estrazione delle entità chiave (es. tipo di servizio, preferenze, parametri temporali).
  • Dialog Management System: Un sistema di gestione del dialogo che governa il flusso della conversazione con l’interlocutore umano, capace di gestire deviazioni e richieste di chiarimenti.
  • Natural Language Generation (NLG) e Text-to-Speech (TTS): Per generare un parlato naturale e contestualmente appropriato, identificandosi come un assistente AI.

Il workflow prevede l’acquisizione dei parametri dall’utente, l’esecuzione autonoma della chiamata, l’estrazione delle informazioni rilevanti durante il dialogo e, infine, la strutturazione di questi dati in un output sintetico consegnato all’utente via API di messaggistica (SMS o email).

La piattaforma prevede inoltre un’interfaccia di controllo per le attività commerciali tramite Google My Business, che consente di implementare un meccanismo di opt-out dal servizio di chiamate AI, un aspetto cruciale per la governance e l’adozione del sistema. Questa strategia di rilascio, limitata a specifiche categorie e geografie, segue un approccio di testing A/B per validare la robustezza e l’accettazione del sistema prima di un’eventuale deployment su larga scala.