Technical SEO nell’era dell’AI
Schema markup, llms.txt, structured data, AI visibility: come farsi leggere e citare dai sistemi generativi
Quando ChatGPT risponde a una domanda o Google mostra una AI Overview, da dove arrivano quelle informazioni? Nella maggior parte dei casi, da siti web come il tuo. A condizione, però, che siano strutturati nel modo giusto per essere letti anche dai sistemi di intelligenza artificiale. Oggi non basta essere online: bisogna essere comprensibili alle macchine, e abbastanza autorevoli da essere scelti come fonte.
La posta in gioco è già concreta. Studi recenti stimano che circa il 37-38% degli acquisti sia oggi influenzato da una raccomandazione dell’AI. Chi non presidia questo spazio sta rinunciando a una quota crescente di pubblico che preferisce fare una domanda a un chatbot piuttosto che aprire dieci schede del browser.
Come i sistemi AI leggono un sito web
Fino a qualche tempo fa, l’unico “lettore automatico” da tenere in considerazione era Googlebot, il crawler che scansiona e indicizza le pagine. Lo scenario adesso è più affollato: ci sono nuovi bot, chiamati LLM crawler (Large Language Model crawler), come GPTBot di OpenAI, Claudebot di Anthropic, PerplexityBot e Bingbot AI, che visitano i siti per raccogliere contenuti da usare nelle risposte generate.
Questi sistemi leggono le pagine in modo diverso da Google: spesso non eseguono JavaScript e quindi non vedono i contenuti caricati dinamicamente. Funzionano meglio con testi lineari, ben organizzati e subito comprensibili.
C’è però un aspetto che in pochi considerano. Quando un utente fa una domanda a ChatGPT o Perplexity, il sistema non cerca semplicemente su Google e restituisce il primo risultato. Lancia una serie di ricerche parallele su angolazioni diverse dello stesso argomento, raccoglie i siti che compaiono più spesso attraverso queste query, scarica i contenuti più utili e si costruisce una memoria temporanea (tecnicamente: RAG, Retrieval Augmented Generation) su cui poggia l’intera conversazione.
Questo processo di selezione spiega un fenomeno che molti stanno scoprendo con sorpresa: siti ben posizionati su Google che non compaiono mai nelle risposte dei sistemi AI. Succede quando i contenuti, pur ottimizzati per il ranking, sono troppo sintetici o costruiti attorno a logiche che premiano la forma tecnica rispetto alla qualità informativa. L’AI li ignora perché non reggono una conversazione su più domande.
Mentre Google indicizza le pagine per mostrarle nei risultati, i sistemi AI lavorano per ingestion: raccolgono contenuti da cui estrarre informazioni per generare risposte. In questo nuovo paradigma la visibilità dipende dalla capacità di essere citati, non solo dalla posizione in SERP.
Schema markup: il linguaggio che l’AI capisce
Lo schema markup è un codice inserito nelle pagine web che etichetta il contenuto, rendendolo leggibile alle macchine in modo preciso. Grazie a queste etichette, un sistema AI sa subito se sta leggendo un articolo, una domanda con la sua risposta, una guida pratica o la scheda di un autore. È un po' come aggiungere didascalie a un'immagine: il contenuto non cambia, ma chi lo legge capisce subito di cosa si tratta.
Tra i formati più utili ci sono Article, FAQPage, HowTo e Person, che aiutano a rendere i contenuti interpretabili e ne rafforzano la credibilità agli occhi dei sistemi automatici.
Un caso concreto: una pagina con markup FAQPage ha più probabilità di finire nelle AI Overviews perché il sistema riconosce immediatamente la struttura domanda-risposta e sa già come usarla.
llms.txt e robots.txt: gestire i bot nell’era AI
Il file robots.txt è uno strumento storico della SEO tecnica: indica ai crawler quali sezioni del sito possono essere visitate. Con la diffusione dei bot AI ha assunto un ruolo più strategico: permette di decidere se aprire o chiudere il sito ai sistemi generativi. Lasciare accesso significa aumentare le possibilità di essere citati; bloccarlo protegge i contenuti ma taglia fuori dalla visibilità AI.
Sta emergendo anche llms.txt, un file pensato specificamente per guidare i sistemi AI nella lettura dei contenuti. A differenza di robots.txt non blocca nulla: fornisce contesto e indicazioni su come interpretare il sito. È uno standard però ancora in evoluzione.
Struttura del contenuto AI-ready: pensare per argomenti, non per keyword
I sistemi AI cercano informazioni chiare e subito fruibili. Per questo la struttura del contenuto diventa decisiva: titoli gerarchici (H1, H2, H3), paragrafi brevi e risposte che arrivano subito, senza fronzoli introduttivi. Le sezioni FAQ funzionano bene proprio per questo motivo: rendono il contenuto più leggibile per chi cerca risposte rapide, umano o macchina che sia.
Il punto che cambia rispetto alla SEO tradizionale è la profondità tematica. L’AI non cerca la pagina che risponde alla singola domanda: cerca il contenuto che regge un’intera conversazione su quell’argomento. Una pagina costruita attorno a una sola keyword, per quanto ottimizzata, non è competitiva quanto un contenuto che tratta il tema a tutto tondo, con le domande correlate, i confronti, i casi d’uso.
Da qui nasce quello che gli esperti chiamano Prompt Research: invece di chiedersi “per quale keyword devo posizionarmi?”, ci si chiede “se un utente fa questa domanda all’AI, cosa va a cercare su Google per costruire la risposta?”. Il contenuto viene poi progettato per coprire tutto quello spazio, non solo il centro.
Vale anche la regola che l’AI tende a leggere le prime righe di ogni paragrafo. Se la risposta è sepolta in fondo a un blocco di testo, semplicemente non viene estratta. Scrivere in modo chiaro e diretto non è una concessione alle macchine: è giornalismo di qualità, che funziona per chiunque.
E-E-A-T nell’era generativa: l’autorità non si improvvisa
Experience, Expertise, Authoritativeness e Trustworthiness: il framework con cui Google valuta la qualità dei contenuti è diventato rilevante anche per i sistemi AI. Un contenuto ha più probabilità di essere citato se è firmato da un autore riconoscibile, supportato da dati e fonti verificabili, e aggiornato nel tempo.
I sistemi generativi saltano i contenuti generici: possono produrne di simili in autonomia, quindi non hanno motivo di citarli. Privilegiano le fonti che portano qualcosa in più: un punto di vista originale, dati di prima mano, esperienza diretta sul tema.
C’è però una variabile che spesso viene ignorata: cosa sa l’AI di te prima ancora di cercare sul web. I modelli linguistici vengono addestrati su grandi corpus di testi fino a una certa data (il cosiddetto knowledge cutoff), dopo la quale le informazioni non vengono aggiornate automaticamente. Se nel frattempo hai cambiato servizi, prezzi, posizionamento o nome, il modello potrebbe ancora restituire le vecchie informazioni, o peggio, riempire i vuoti con dati inventati.
Fare un audit su questa conoscenza interna, verificare cioè cosa sa un’AI del tuo brand senza consultare il web, è diventato il punto di partenza di qualsiasi strategia GEO seria. Se emergono lacune o imprecisioni si interviene su due fronti: on-site, rendendo le informazioni sul sito più chiare e complete; off-site, con attività di digital PR costruite per creare un ecosistema di fonti coerenti intorno al brand.
AI Visibility: il KPI che mancava
Se la SEO tradizionale si misura con il ranking, la GEO (Generative Engine Optimization) introduce un indicatore diverso: lo share of model, ovvero quante volte i tuoi contenuti vengono scelti come fonte da un motore generativo rispetto a quelli dei competitor.
La domanda non è più "in che posizione mi trovo su Google?", ma "chi parla di me quando un utente chiede a ChatGPT o Gemini di confrontare soluzioni nel mio settore?". Se i tuoi contenuti non vengono scelti come fonte in quella conversazione, sei assente nel momento in cui l’utente sta già decidendo.
Monitorare l’AI visibility serve anche a capire quali fonti influenzano le risposte al tuo posto. Se un articolo datato su un sito terzo sta fornendo informazioni sbagliate sul tuo brand a ChatGPT, puoi contattare il proprietario e chiedere una correzione. È un tipo di lavoro che assomiglia più alle relazioni pubbliche che alla SEO classica, ma è diventato parte del mestiere.
Oltre il sito web: YouTube, social e menzioni
I sistemi AI attuali non leggono solo pagine web. Sono multimodali: analizzano trascrizioni di video, thread di forum, discussioni su Reddit. YouTube in particolare è una fonte sempre più citata nei prompt, perché i sistemi AI riescono a estrarre informazioni dai sottotitoli e dai transcript e a usarle per costruire le risposte.
Questo apre una strada che va oltre la SEO classica. Produrre contenuti video di qualità, presidiare le conversazioni nei forum di settore e mantenere una presenza coerente sui social non è più solo una questione di brand: è un modo per aumentare le superfici attraverso cui l’AI può trovarti e usarti come fonte.
Sul fronte delle fonti esterne si sta affermando anche una pratica nuova: ottenere menzioni senza link. Per anni il SEO ha ragionato in termini di backlink. Oggi, per influenzare come un’AI parla di te, può essere ugualmente utile far sì che fonti autorevoli citino il tuo brand o la tua expertise in modo naturale all’interno di un testo, anche senza un link. L’AI legge le parole, non solo i collegamenti.
Il sito web nell’era zero-click: meno visite, più qualità
C’è un cambiamento che le aziende faticano ancora ad accettare: il sito web sta smettendo di essere il luogo dove le persone cercano informazioni. Quelle le ottengono già dall’AI. Sul sito ci arrivano dopo, quando la scelta è già in buona parte formata.
Il ruolo del sito cambia, ma non si svuota: diventa il punto in cui l’AI ha imparato a parlare con la tua voce e dove l’utente arriva per confermare ciò che già sa. Il traffico informazionale cala, quello transazionale rimane e in certi casi cresce. Visite meno numerose, ma di utenti che sanno già cosa vogliono.
Per un e-commerce o un fornitore di servizi questo può essere un vantaggio netto: se l’AI impara a raccomandare il tuo prodotto nelle conversazioni giuste, raggiungi un pubblico già orientato all’acquisto. L’intelligenza artificiale sta diventando il punto di riferimento che prima era l’influencer o il motore di ricerca. Con una differenza: non si paga, si guadagna.
Dalla SEO tecnica all’agentic AI as a service
In Mashfrog questo cambiamento non viene affrontato come un’evoluzione della sola SEO o della produzione di contenuti, ma come una trasformazione dell’intera catena del valore digitale. Lavoriamo con team multidisciplinari di specialisti — dalla data architecture alla UX, fino all’AI engineering — in grado di comprendere, dialogare e performare con sistemi machine-readable.
Mashfrog si sta caratterizzando sempre più come una agentic AI as a service organization: un partner che non si limita a ottimizzazione per motori o modelli, ma in grado di costruire ambienti in cui gli agenti AI possano operare, apprendere e interagire in modo efficace con dati, contenuti e servizi. La Technical SEO diventa quindi uno dei layer di un sistema più ampio, in cui struttura, semantica, accessibilità e governance delle informazioni lavorano insieme per rendere i brand realmente “presenti” e parlante con gli ecosistemi AI.
Il valore non si gioca più su singoli asset, ma sulla capacità di orchestrare competenze e tecnologie per guidare come le intelligenze artificiali leggono, comprendono e aiutano il business. Chi riesce a governare questo livello non è solo visibile: diventa parte attiva delle logiche decisionali che le AI mettono in campo ogni giorno. Mentre chi rimanda la rivoluzione della SEO tecnica, invece, rischia di scomparire non solo da Google, ma da tutte le conversazioni che contano davvero.
FAQ
Cos’è un LLM crawler?
È un bot usato dai sistemi AI per raccogliere contenuti dai siti web e integrarli nelle risposte generate.
A cosa serve lo schema markup?
Descrive il contenuto di una pagina in modo strutturato, così che motori di ricerca e sistemi AI possano capire subito di cosa si tratta.
Cos’è llms.txt?
È un file che fornisce ai sistemi AI indicazioni su come leggere e interpretare i contenuti di un sito.
Devo bloccare i bot AI nel robots.txt?
Dipende dalla strategia. Bloccarli protegge i contenuti, ma riduce le possibilità di essere citati nei sistemi generativi.
Come rendere un contenuto AI-ready?
Con una struttura chiara, titoli gerarchici, risposte dirette fin dalle prime righe e una copertura completa dell’argomento, non solo della keyword principale.
Cos’è lo share of model?
Il KPI principale della GEO: misura con quale frequenza i tuoi contenuti vengono scelti come fonte dai motori generativi rispetto ai competitor.
Un buon posizionamento su Google garantisce visibilità nell’AI?
No, non automaticamente. Un sito può essere in prima pagina su Google ed essere ignorato dall’AI se i contenuti non sono abbastanza esaustivi o sono costruiti solo per il ranking.
Cos’è la Prompt Research?
L’evoluzione della keyword research: si analizzano le sotto-query che un sistema AI farebbe su Google per rispondere a un certo prompt, e si costruisce il contenuto per coprire quell’intero insieme di domande, non solo quella principale.