Una sitemap XML è un file che elenca tutte le pagine importanti del tuo sito web in un formato strutturato facilmente leggibile dai motori di ricerca. Consideralo come un sommario per il tuo sito. Sebbene i crawler dei motori di ricerca scopriranno eventualmente la maggior parte delle tue pagine tramite link, una sitemap accelera questo processo e assicura che nulla di importante venga trascurato, specialmente su siti grandi con centinaia o migliaia di pagine.
Cosa contiene effettivamente una sitemap
Nel suo nucleo, una sitemap XML è un elenco di URL con metadati opzionali per voce. Ecco cosa significa ogni campo:
<loc>: l'URL completo della pagina. È l'unico campo obbligatorio.<lastmod>: la data in cui la pagina è stata modificata l'ultima volta. Google usa questo per determinare se la pagina deve essere ri-scansionata. Se aggiorni un articolo del blog, la data lastmod dovrebbe riflettere quella modifica.<changefreq>: la frequenza con cui la pagina probabilmente cambia (always, hourly, daily, weekly, monthly, yearly, never). In pratica, Google ignora in gran parte questo campo e si affida ai propri dati di scansione.<priority>: un valore tra 0,0 e 1,0 che indica l'importanza relativa della pagina all'interno del tuo sito. Come changefreq, oggi è in gran parte ignorato da Google. Era più rilevante agli inizi delle sitemap.
Struttura della sitemap e file di indice sitemap
Un singolo file sitemap può contenere fino a 50.000 URL e non deve essere più grande di 50 MB in forma non compressa. Per la maggior parte dei siti WordPress piccoli e medi, un file è più che sufficiente. Ma siti più grandi (negozi WooCommerce con migliaia di prodotti, siti di notizie con archivi pluriennali) raggiungono rapidamente quel limite.
La soluzione è un file di indice sitemap. Invece di elencare direttamente gli URL, il file di indice punta a più sitemap più piccole:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/post-sitemap.xml</loc>
<lastmod>2025-03-15</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/page-sitemap.xml</loc>
<lastmod>2025-02-20</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/product-sitemap.xml</loc>
<lastmod>2025-03-18</lastmod>
</sitemap>
</sitemapindex>Sia Yoast SEO che Rank Math suddividono automaticamente la tua sitemap in file più piccoli, organizzati per tipo di contenuto (post, pagine, categorie, prodotti, ecc.).
Un semplice esempio di sitemap
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2025-03-15</lastmod>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about/</loc>
<lastmod>2025-01-10</lastmod>
<priority>0.8</priority>
</url>
</urlset>Come Google Search Console usa la tua sitemap
Inviare la tua sitemap a Google Search Console è una delle prime cose da fare dopo il lancio di un sito WordPress. Una volta inviata, Search Console mostra quanti URL Google ha trovato nella sitemap e quanti di essi sono effettivamente indicizzati. Questo è particolarmente utile per diagnosticare problemi. Se la tua sitemap elenca 500 pagine ma solo 300 sono indicizzate, sai che c'è un problema che merita un'indagine. Forse alcune pagine sono troppo sottili, duplicate o restituiscono errori.
Google Search Console mostra anche quando la sitemap è stata letta l'ultima volta da Googlebot, in modo che tu possa confermare che Google controlla regolarmente gli aggiornamenti.
WordPress e le sitemap
Dalla versione 5.5, WordPress genera automaticamente una semplice sitemap XML su /wp-sitemap.xml. Questa sitemap integrata è funzionale ma piuttosto basilare. Contiene post, pagine e tipi di post personalizzati, ma manca delle funzionalità offerte dai plugin SEO.
La maggior parte dei proprietari di siti usa invece un plugin SEO, perché i plugin offrono più controllo:
- Yoast SEO: genera sitemap su
/sitemap_index.xml, le divide per tipo di post, include riferimenti alle immagini all'interno di ogni voce URL ed esclude automaticamente il contenuto noindex. - Rank Math: funzionalità simile, accessibile su
/sitemap_index.xml. Supporta anche sitemap di notizie e sitemap video per siti con quel tipo di contenuto.
Quando attivi un plugin SEO che genera sitemap, la sitemap del core WordPress viene tipicamente disabilitata per evitare conflitti.
Cosa includere e cosa escludere
La tua sitemap dovrebbe essere un elenco curato con attenzione di pagine che vuoi effettivamente che vengano indicizzate dai motori di ricerca. Questo significa essere selettivo:
- Includere: articoli del blog pubblicati, pagine importanti (chi siamo, contatti, servizi), pagine prodotto, pagine categoria con contenuto significativo.
- Escludere: pagine con noindex, pagine di contenuto sottile (archivi tag con solo uno o due post), pagine di archivio paginate (/page/2/, /page/3/), pagine di risultati di ricerca interna, pagine di login o registrazione, pagine di ringraziamento dopo invii di moduli.
Una sitemap gonfia piena di URL di bassa qualità può effettivamente danneggiare la tua SEO. Google ha un budget di scansione limitato per sito, e se trascorre tempo scansionando pagine che non meritano indicizzazione, le tue pagine importanti possono essere scansionate meno frequentemente.
La direttiva Sitemap in robots.txt
Il tuo file robots.txt dovrebbe contenere una riga che punta alla tua sitemap:
Sitemap: https://example.com/sitemap_index.xmlQuesto aiuta i motori di ricerca a trovare la tua sitemap, anche se non l'hai inviata tramite Search Console. La maggior parte dei plugin SEO aggiunge automaticamente questa riga. Se hai un file robots.txt personalizzato, assicurati che la direttiva Sitemap sia presente e punti all'URL corretto.
Errori comuni della sitemap
Alcune insidie si verificano regolarmente con le sitemap WordPress:
- Includere URL noindex: se una pagina ha un meta tag noindex ma è nella sitemap, invii a Google segnali contrastanti. La pagina dice "non indicizzarmi" mentre la sitemap dice "indicizzami per favore". I plugin SEO tipicamente gestiscono questo correttamente, ma le sitemap create manualmente possono mostrare questo problema.
- Date lastmod obsolete: alcune configurazioni non aggiornano mai il timestamp lastmod. Se ogni pagina nella tua sitemap mostra la stessa data di tre anni fa, Google non si fida più dei dati lastmod e ricade sul proprio programma di scansione.
- Dimenticare di aggiornare dopo la migrazione: dopo aver trasferito a un nuovo dominio o cambiato la tua struttura URL, la sitemap spesso contiene ancora vecchi URL. Questo porta a un'ondata di errori 404 in Search Console.
- Più sitemap in conflitto: avere attive contemporaneamente la sitemap del core WordPress e una sitemap di plugin. Sebbene questo non sia di per sé dannoso, può causare confusione nella risoluzione dei problemi di indicizzazione.
Cosa controlla InspectWP
InspectWP verifica se il tuo sito WordPress ha una sitemap XML accessibile. Cerca l'URL della sitemap nel tuo file robots.txt e prova percorsi comuni come /sitemap.xml, /sitemap_index.xml e /wp-sitemap.xml. Se viene trovata una sitemap, InspectWP conferma che è raggiungibile e valida, in modo che tu possa identificare problemi come URL sitemap rotti o direttive sitemap mancanti prima che influiscano sulla tua visibilità nei risultati di ricerca.