Il tema dei contenuti duplicati in ambito SEO è sicuramente uno degli argomenti più importanti da affrontare. Un aspetto fondamentale, da curare con attenzione, per evitare di andare ad inficiare il lavoro di tecnici e sviluppatori.
Che cosa si intende per contenuto duplicato?
Un contenuto duplicato si ha quando un’intera pagina o gran parte del contenuto di diverse pagine è ripetuto su più URL.
I contenuti duplicati tipicamente sono presenti in un dominio dove più pagine dello stesso sito internet hanno il medesimo contenuto. Tuttavia, i contenuti duplicati possono presentarsi anche su più domini (o subdomini) che hanno lo stesso contenuto.
Perché i contenuti duplicati sono un problema?
I contenuti duplicati (che si possono presentare come esatta duplicazione o approssimativa) spesso confondono i search robots che decidono quali pagine classificare (o meno) nei risultati di ricerca. Ancora peggio, le pagine duplicate nello stesso sito possono finire per creare un’auto-competizione nella rincorsa al posizionamento sui motori di ricerca.
Di fronte a contenuti duplicati Google e gli altri motori di ricerca devono fare una scelta per risolvere il problema di duplicazione, ma la pagina scelta potrebbe non essere quella che vuole l’azienda. In alternativa, Google potrebbe decidere di ignorare e non classificare nessuna pagina duplicata.
Inoltre in alcuni casi, i motori di ricerca possono penalizzare un sito con un’eccessiva presenza di contenuti duplicati e di conseguenza non classificarlo nei risultati di ricerca. Questo è particolarmente vero se le pagine duplicate sono state create per manipolare i motori di ricerca.
In fine, trovare pagine duplicate all’interno di un sito internet può danneggiare la user experience degli utenti, che, a causa di un numero elevato di contenuti duplicati, possono disorientarsi e diminuire le interazioni con il sito stesso.
Esempi di contenuti duplicati.
Le pagine categoria di un blog sono tipici esempi di contenuti duplicati. Se tutti i post del blog vengono aggiunti alla Categoria A, di conseguenza la pagina per la Categoria A conterrà lo stesso contenuto della pagina principale del blog, solo in un ordine differente.
E’ dunque importante pensare al modo migliore di suddividere le categorie del blog in modo da evitare problemi di duplicazione.
contenuti duplicati possono essere anche accidentali. Questo succede molto spesso all’interno di siti web di grandi aziende dove più persone o dipartimenti sono responsabili dell’aggiornamenti di contenuti. Il modo migliore per evitare questo tipo di problema è quello di definire un piano editoriale.
Ci sono poi cause di tipo tecnico. Per esempio, un CMS (Content Management System) potrebbe permettere ad una pagina di indirizzare a due differenti URL. Per esempio, un post del blog potrebbe essere disponibile all’indirizzo site.com/post.php?id=1 e all’indirizzo site.com/blog/blog-title, creando così un contenuto duplicato. Questo tipo di errore si può sistemare impostando il CMS in modo che indirizzi ad un’unica pagina oppure creando un URL canonico.
Cos’è un URL Canonico?
Un modo per risolvere la problematica dei contenuti duplicati è quello di definire un URL canonico. L’URL canonico è la versione preferita di un URL.
Per esempio, consideriamo che le URL site.com/A, site.com/B, e site.com/C abbiano tutte lo stesso contenuto. In questo esempio, site.com/B è definito come URL canonico. Così facendo, significa che andremmo a dire ai robots dei motori di ricerca di ignorare i contenuti duplicati trovati in site.com/A e site.com/C andando invece a classificare site.com/B.
Per comunicare l’URL canonico ai motori di ricerca è necessario aggiungere una riga di codice all’interno delle pagine duplicate. Questo codice andrà inserito nella <head> della pagina.
Quindi se site.com/A, site.com/B, e site.com/C hanno elementi duplicati (esatti o approssimativi) e site.com/B è scelto come URL canonico, il seguente testo di codice andrà inserito nella sezione <head> di site.com/A, site.com/B, e site.com/C.
<link rel=”canonical”
href=”https://site.com/B” />
Altra cosa importante da considerare è il fatto che un link canonico può essere definito anche tra domini. Per esempio, se siteone.com/A contiene lo stesso contenuto di sitetwo.com/A, un link canonico potrebbe essere usato per dire ai motori di ricerca quale pagina di un determinato sito debba essere considerata la versione “ufficiale” e di conseguenza indicizzata.