Skip to main content

Comunicare con Google: 404, Redirect, Canonical, Noindex e Disallow

  April 16, 2019    

Creazione siti web Brescia - sem-seo.it

Ci sono tantissime implementazioni che puoi mettere in atto per rendere il tuo sito più comprensibile per Google.

Scopri come utilizzare i tag per rendere il tuo sito web il più comprensibile possibile.

Ecco quali sono i tag più importanti, che andremo ad analizzare in questo articolo:

  • Tag 404

  • Tag Redirect

  • Tag Noindex

  • Tag Canonical

  • Tag Disallow


Tag 404

Tag 404 e pagine cancellate - sem-seo.it

Il tag 404 (o errore 404) dice a Google che la tua pagina non esiste più.

Devi utilizzare il tag 404 quando:

  • La pagina non ha traffico organico;

  • La pagina non ha backlink;

  • Non esistono pagine correlate di valore nel tuo sito;

  • La pagina non ha utilità né per i motori di ricerca né per gli utenti che visitano il tuo sito.

Comunicare a Google che una pagina non esiste più è molto semplice: basta cancellare quella pagina dal sito e dal file sitemap.xml.

È importante cancellare la pagina dalla sitemap: questa infatti mostra a Google quali sono le pagine che sono importanti del sito e che Google deve considerare e indicizzare. Lasciare un link che porta ad una pagina che non esiste più non ha senso e può essere anzi dannoso.

Google all’inizio sarà confuso e nella Google Search Console ti mostrerà un errore: ti dirà “Pagina Non Trovata: Esclusa 404”.

Dato che la pagina l’hai cancellata volutamente devi ignorare l’errore. Dopo un po’ di tempo Google si rassegnerà, smetterà di farti notare che la pagina è un errore 404 e la dimenticherà.

Gli errori 404 sono un problema?

Quando nella Google Search Console ci sono delle pagine segnalate come 404 che tu non hai eleminato significa che nel tuo sito ci sono degli errori.

C’è stato un problema e devi capire che cosa è successo. Se riesci dovresti anche cercare di ricreare quelle pagine il più velocemente possibile, prima che vengano eliminate dai risultati di ricerca.

Come abbiamo detto c’è in Google Search Console c’è l’elenco di tutte le pagina 404. Ogni tanto dai un’occhiata per capire se ci sono dei 404 non voluti.


Tag Redirect

Redirect come funziona - sem-seo.it

I redirect sono un modo per mantenere il traffico o il link juice e nello stesso tempo eliminare una pagina vecchia che non puoi aggiornare.

Ci sono vari tipi di redirect, ma i più importanti e utilizzati sono due:

301: Redirect Permanente

Un redirect 301 viene utilizzato per assicurarsi che sia i motori di ricerca e gli utenti vedano una pagina esistente e non quella cancellata.

Comunica a Google che la pagina vecchia è stata cancellata definitivamente e che deve considerare la nuova pagina.

Il Redirect 301 permette di trasferire il valore che i link danno alla vecchia pagina (link juice) ad una nuova pagina. Non solo, permette trasferire sia il traffico che il posizionamento SEO alla nuova pagina.

Quando è appropriato un redirect 301?

Come abbiamo detto un redirect 301 è permanente. Ecco quando è utile:

  • Hai una pagina vecchia e inutile per i visitatori, che trarrebbero beneficio a vedere una pagina più utile. Questa pagina di poco valore ha però del traffico dai motori di ricerca e ha dei link in entrata, quindi non puoi cancellarla;

  • Il tuo sito web ha due versioni: con il www e una senza www;

  • Hai cambiato il tuo dominio e quindi devi spostare tutto il link juice da un sito all’altro, senza avere pagine 404 e comunicando a Google che il tuo dominio è cambiato;

  • Stai migrando il tuo sito da HTTP alla versione HTTPS.

La tua pagina precedente sarà sostituita dalla nuova pagina nei motori di ricerca, con solo qualche variazione di posizionamento.

302: Redirect Temporaneo

Questo è un redirect che si utilizza per pagine che devono essere spostate temporaneamente.

Devi utilizzare i redirect 302 con attenzione: fare un redirect 302 nel modo sbagliato significa perdere posizionamenti sui motori di ricerca. Quando devi utilizzare un redirect 302?

Ci sono dei momenti in cui è utile utilizzare un redirect 302, ecco quali sono:

  • Se vuoi fare dei test A/B. Per capire quale versione di una pagina ha migliore performance, devi utilizzare un redirect 302, perché in questo modo il vecchio URL rimarrà comunque indicizzato;

  • Avere un feedback da un cliente su una variazione di una pagina già online, senza che questo impatti i risultati di ricerca;

  • Aggiornare i contenuti di una pagina senza che gli utenti se ne accorgono. Una volta finita la modifica potrai rendere la pagina originale di nuovo visibile.

Quando utilizzare i Redirect?

I redirect servono quando ha una vecchia pagina che vuoi eliminare, ma che ha dei link o del traffico. Allora fai un redirect che punta ad una nuova pagina, che però ha gli stessi (o simili) contenuti.


Tag Noindex

Devi utilizzare il tag Noindex per tutte quelle pagine servono all’utente ma non sono utili a Google.

Per quali pagine è utile il Noindex:

  • La pagina non ha traffico;

  • La pagina non ha backlink;

  • La pagina non ha valore per i motori di ricerca;

  • La pagina ha una funzione per gli utenti.

Il noindex funziona così: Google trova la tua pagina, la legge e vede il tag noindex e non la inserisce nell’indice di tutti i risultati di ricerca.

Normalmente ogni pagina è considerata come “indicizzata” e per non farla indicizzare devi inserire questo tag nell’html della pagina: meta name="robots" content="noindex".

Esempi di pagine con cui puoi utilizzare il tag Noindex

Pagine di ringraziamento

Queste sono le pagine che servono a ringraziare l’utente dopo che compie una determinata azione, come contattarti, iscriversi alla tua newsletter o scaricare dei contenuti.

Queste pagine sono utili ai visitatori, ma spesso hanno pochi contenuti e non interessano ai motori di ricerca.

Pagine solo per gli iscritti

Se hai una selezione di pagine sul tuo sito che sono accessibili solo agli iscritti dovresti utilizzare il tag noindex. Questo perché non hanno bisogno di essere viste da tutti gli utenti e non hanno bisogno di essere indicizzate dai motori di ricerca.

Pagine di login e pagine riservate agli admin

È ovvio che le pagine di login non dovrebbero essere tra i risultati di ricerca di Google.

Tieni la tua pagina di login e le pagine riservate all’admin fuori dai risultati di ricerca.

Risultati di ricerche interne

I risultati di ricerche interne al tuo sito sono le ultime pagine a cui Google vuole mandare i suoi utenti.

Ma queste pagine hanno molto valore per gli utenti. Permettono agli utenti che sono già nel tuo sito di trovare facilmente quello che stanno cercando. Quindi devi tenerle, ma non puoi farle vedere ai motori di ricerca. Il noindex è la soluzione perfetta.


Tag Canonical

Per quali pagine devi utilizzare il canonical? Il tag canonical serve a spiegare a Google quale pagina deve considerare quando ci sono tante pagine simili.

Ad esempio nel caso di un ecommerce, ci sono varie pagine prodotto, nel nostro esempio sarà una maglietta, che è presente in cinque colori.

Ogni colore in realtà è, per Google, una pagina a se stante. Google vede cinque pagine diverse e pensa che tu abbia del contenuto duplicato.

Per evitare questo devi scegliere una versione della maglietta, ovvero una delle cinque pagina, e inserire in questa il tag: rel="canonical"

Se utilizzi una delle piattaforme per creare ecommerce più comuni, come Prestashop, il tag canonical viene inserito in automatico. Non darlo per scontato però, controlla sempre, perché inserire il tag canonical è molto importante per posizionarti nei motori di ricerca.

Devi utilizzare il canonical per:

  • pagine molto simili tra di loro;

  • pagine che sono utili ai motori di ricerca, ovvero che possono migliorare il tuo posizionamento;

  • pagine che sono utili ai visitatori

Il rel=”canonical” spiega a Google che c’è una versione principale della pagina e che tutte le copie non sono da considerare, anzi, che Google dovrebbe ignorarle.

Tag Disallow

Il disallow serve a comunicare a Google che non deve fare la scansione di una pagina. Questo non significa che non verrà mai indicizzata, anzi, Google potrebbe inserirla comunque nei risultati di ricerca. Significa che Google non leggerà i contenuti della pagina. Per evitare che una pagina non venga “letta” da Google, ma venga indicizzata devi inserire anche il tag noindex.

Cosa succede quando una pagina con il solo disallow viene indicizzata? Nei risultati di ricerca apparirà il titolo e non ci sarà la meta description.

Il disallow è un comando che viene dato nel file robot.txt.

Come combinare Noindex e Disallow

Quando vuoi combinare il noindex e il disallow devi prendere un approccio diverso da quello usuale. Infatti normalmente il noindex va inserito nell’HTML della pagina, ma se questa ha il disallow nel robot.txt Google non leggerà l’HTML nella pagina, quindi non potrà vedere il noindex.

Per fortuna c’è un altro modo di dare il noindex ad una pagina: inserirlo insieme al disallow nel file robot.txt

Ecco come potrebbe essere il tuo file robot.txt:

Disallow: /pagina-di-esempio-1/

Disallow: /pagina-di-esempio-2/

Noindex: /pagina-di-esempio-1/

Noindex: /pagina-di-esempio-2/


Conclusione

Riepiloghiamo quello che abbiamo detto:

  • 404: quando hai una pagina che non ha link, visite e non è rilevante per i motori di ricerca, puoi cancellarla. Google vedrà questo come un errore 404, ma non devi preoccuparti se la pagina l’hai cancellata apposta. Se invece hai pagine in 404 che non hai cancellato devi fare delle ricerche;

  • Redirect 301: questo tipo di redirect serve per le pagine che hanno link juice ma non hanno più valore per l’utente. Se hai una pagina con contenuto rilevante a quello della vecchia puoi fare un redirect permanente;

  • Redirect 302: se vuoi fare dei test per capire quale tra due pagine con contenuti simili piace di più agli utenti puoi utilizzare un redirect temporaneo, ovvero un redirect 302;

  • Canonical: il canonical serve a far capire a Google, tra varie pagine molto simili tra loro, quale tra queste è da prendere in considerazione. In questo modo ignora le altre e non ti penalizza per le pagine duplicate;

  • Noindex: questo comando serve a dire a Google di non indicizzare la tua pagina. Questo comando puoi inserirlo sia nel file robot.txt sia nell’HTML della pagina;

  • Disallow: puoi utilizzare il disallow quando non vuoi che Google legga il contenuto della tua pagina. Ricordati, Google continuerà ad indicizzare quella pagina, ma non ne leggerà il contenuto. Si inserisce nel file robot.txt.

Buona ottimizzazione!

 

Scroll