Analisi SEO dei link della sitemap in modo quasi automatico con Excel
Esistono molti tool che permettono di verificare quali url del sito sono state indicizzate e di fare dei veloci controlli, ma ritengo che ogni tanto è bene poter effettuare queste verifiche “manualmente” facendo un match con i dati estratti da più fonti. A partire dalla sitemap del sito, infatti, vedremo come sia possibile creare un file in modo da capire se tutti i link segnalati ai motori di ricerca presentino delle anomalie in modo da agire prontamente e risolvere il problema.
Per fare questo abbiamo bisogno di:
- Excel
- SEO Tool For Excel (http://seotoolsforexcel.com/)
- Xenu (http://home.snafu.de/tilman/xenulink.html)
Come prima cosa scarichiamo la Sitemap.xml che generalmente è presente nella root del sito e che di solito corrisponde a: http://www.tuodomino.com/sitemap.xml.
Successivamente scarichiamo e installiamo Xenu sul PC e lo avviamo.
Andiamo su Option –> Preferences e settiamo il numero di esecuzioni parallele ad 1. In questo modo sarà più preciso ma richiederà un po’ di tempo in più.
Fatto questo possiamo inserire l’url da scansionare e attendere che il lavoro sia completato. Di norma ci vuole poco.
Infine, sempre dal menù File, clicchiamo su “Export to TAB separated file” e salviamo in formato testo.
Arrivati a questo punto non ci resta che scaricare il plug in SEO Tool for Excel e seguendo la guida inclusa nel pacchetto oppure quella on line sul sito integrarlo con Excel. Se tutto è andato bene dovreste vedere nel software una nuova tab:
I comandi sono di facile comprensione ed è subito intuitivo e immediato capirne il significato ed utilizzarli.
Ora che abbiamo tutto il necessario si può passare alla parte operativa e di analisi.
Carichiamo come prima cosa il file della sitemap, sitemap.xml, in Excel.
Seguendo tutti i vari passaggi fino ad arrivare all’ultimo.
Qui ci viene mostrata la tabella con tutti i link presenti nella sitemap importata dove le colonne prendono il nome della sintassi XML. Ad esempio:
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://www.optimizedgroup.it/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
Gli url quindi saranno nella colonna che corrisponde al tag <loc></loc> e che in Excel viene identificata come ns1:loc, la data di ultima modifica apparirà nella colonna ns1:lastmod ecc.
Per cui avrete una tabella con tutte le url, quelle della sitemap che possono differire dalle pagine indicizzate dai motori di ricerca, e tutti gli altri vari parametri. Se avete più di una sitemap potreste aprire i singoli file .xml e poi tagliarli e incollarli in un unico file per comodità.
Ricordate il file di testo generato da Xenu? Perfetto, adesso è il momento di aprirlo in Excel come è stato fatto per la sitemap, con l’accortezza di spuntare la voce “Dati con intestazioni”. L’immagine mostra visivamente la zona da selezionare:
Cliccando su Avanti, si giunge alla seconda schermata:
Qui bisogna selezionare come delimitatore (o separatore dei dati) “Tabulazione”, in basso è possibile vedere in anteprima come verranno formattati i dati, e cliccare su Avanti impostando il formato come Generale. Il risultato dovrebbe essere simile a questo:
Per migliorare la leggibilità è possibile convertire tutto in tabella, in modo molto semplice.
Fin qui ci dovremmo trovare con un file della Sitemap.xml e uno con i dati di Xenu ma per semplificare le operazioni possiamo creare un unico file con i fogli separati che raccolgono tutti i risultati generati:
Una cosa che possiamo subito fare è quella di creare una nuova colonna in cui mostrare il Tag Title, uno dei più importanti per una pagina web, e verificare se è presente o meno e vedere se rispetta la lunghezza consigliata.
La formuletta che io ho utilizzato è la seguente:
= SE.ERRORE((CERCA.VERT([@Url];Tabella15;6;FALSO));”Title not found”)
Sembra complicata ma non lo è affatto!
Con CERCA.VERT dico ad Excel di cercarmi il valore URL (ossia i link della sitemap) nella tabella in cui ho importato i dati di Xenu, che nel mio caso è Tabella15, e se trova il link esatto, dichiarato con la dicitura FALSO, mi deve prelevare il dato dalla tabella15 all’indice 6 (che nel mio caso corrisponde proprio al tag Title) e mostrarlo nella colonna creata prima del foglio “Sitemap Complete”, altrimenti se la formula restituisce errore (#N/D), quindi tag non trovato mi scrive nella cella “Title not found”.
Per avere idea di quanti caratteri occupa il Tag Title, e se rispetta quindi i consigli per avere una buona posizione del sito su Google, creiamo una seconda colonna, che per comodità ho nominato “Len Title” e applichiamo la facile formula:
=SE([@[Title]]=”Title not found”;”-“;LUNGHEZZA([@[Title]]))
In sostanza stiamo dicendo che se nella cella della colonna Title viene trovata la scritta “Title not found” allora non mostra nessun valore ma il simbolo “-“, altrimenti mostra la lunghezza in caratteri del titolo della pagina.
Altri controlli utili per capire se le url del sito hanno una corretta indicizzazione è verificare ad esempio la Description con la sua relativa lunghezza, lo Status della pagina (ossia che tipo codice restituisce la richiesta), Il Canonical.
Queste utili informazioni è possibile ottenerle grazie al plug in SEO Tool For Excel applicando alcune formule:
= HtmlMetaDescription([@Url])
= HtmlCanonical([@Url])
= HttpStatus([@Url])
Inoltre tramite la seguente formula:
= SE((CONFRONTA([@Url];[@Canonical];0))=1;”Ok”;”Diverso”)
confronto se il Canonical, per le pagine del sito, è impostato correttamente oppure ci sono degli errori.
Come ultimo step e per rendere più visibile i dati che ci interessano possiamo usare il “Formattazione Condizionale” nella scheda Home di Excel in modo da rendere visibile o mostrare al cliente quali sono i link che vanno corretti.
In conclusione per Optimizedgroup.it tutte le pagine presenti nella sitemap sono attive e godono di buona salute, ricordando che questo aiuta sia indicizzare il sito che il suo posizionamento. L’unica accortezza che potrebbe essere migliorata è di revisionare alcune url per il Titolo o la Descrizione in quanto sono troppo corte.
Per maggiori informazioni sull’argomento e per un supporto professionale non esitare a contattarci.
Francesco Currà – SEO