Collegamenti canonici (rel="canonical"). Nuovo tag rel=canonical per rimuovere il tag rel canonical delle pagine duplicate

Se il tuo sito ha contenuti identici o molto simili disponibili in URL diversi, il nuovo formato ti consentirà di specificare quale URL deve essere restituito nel motore di ricerca. Puoi anche essere sicuro che tutte le caratteristiche, come link equity, ecc. saranno trasferiti alla versione corretta dell'indirizzo.

Ora puoi aggiungere questo tag per indicare la versione del tuo indirizzo all'interno del tag su pagine con contenuto duplicato:

In questo modo Google capirà che tutti i duplicati fanno riferimento all'indirizzo canonico specificato nel tag. Ulteriori proprietà dell'indirizzo, come il PageRank e i segnali correlati, verranno trasferite anche dalle pagine duplicate a quella specificata.

Tale tag sarà utile principalmente quando si utilizzano vari motori (phpBB, IPB, WordPress, ecc., Ad esempio, il sito ipbskins.ru - sviluppo del design del sito Web su IPB, è necessario utilizzare un lungo robots.txt per evitare duplicati contenuto), creando molte pagine simili, ad esempio, queste possono essere pagine:

versione stampata dell'articolo:
http://site.ru/article01.html?print=true
versione testuale degli articoli per mob. telefoni:
http://site.ru/lofiversion/article01.html
duplicato per mancanza di motore:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=parola chiave
e tanti altri...

Questo standard può essere adattato da qualsiasi motore di ricerca durante l'indicizzazione di un sito.

Per il popolare motore di blogging WordPress, è già stato sviluppato un plug-in canonico che inserisce un tag nelle pagine desiderate. Altri popolari motori per blog, forum, negozi online, ecc. amplieranno anche le loro funzionalità nel prossimo futuro (rimanete sintonizzati).

Risposte ad alcune domande popolari sul tag:

rel="canonical" è un suggerimento o una direttiva?
Questo è un suggerimento che prendiamo in considerazione e, in interazione con altri segnali, calcoliamo la pagina più pertinente da visualizzare nei risultati di ricerca.

Posso usare un percorso relativo per specificare canonico in questo modo: ?
Sì, i percorsi relativi vengono riconosciuti allo stesso modo di un normale tag . Anche se inserisci il tag con un link al documento, allora verranno considerati i relativi percorsi in base all'URL di base.

Va bene se gli URL canonici contengono meno di contenuti completamente duplicati?
Sono consentite piccole differenze come l'ordinamento nella tabella dei prodotti. Comprendiamo anche che gli indirizzi canonici possono essere analizzati dal robot in momenti diversi, quindi è tutto normale.

Cosa succede se rel="canonical" restituisce un errore 404?
Continueremo a indicizzare i tuoi contenuti e a utilizzare l'euristica per determinare l'indirizzo canonico, tuttavia ti consigliamo di utilizzare gli URL esistenti come URL canonici.

Cosa succede se rel="canonical" non è ancora indicizzato?
Cerchiamo di raggiungere rapidamente l'URL canonico. Non appena lo indicizziamo, riconsideriamo immediatamente il suggerimento rel="canonical".

Un URL canonico può contenere un reindirizzamento?
Sì, puoi specificare un reindirizzamento, nel qual caso il motore di ricerca elaborerà il processo di reindirizzamento come di consueto e tenterà di indicizzare il nuovo indirizzo.

Cosa succede se ho segnali in conflitto per rel="canonical"?
I nostri algoritmi sono delicati: possiamo seguire le catene canoniche, tuttavia, ti consigliamo vivamente di specificare un unico indirizzo canonico sulle tue pagine per garantire risultati di canonicalizzazione ottimali.

Questo tag link potrebbe suggerire un indirizzo canonico su un dominio completamente diverso?
NO. Migrare a un altro dominio è più appropriato. Google attualmente supporta la canonicalizzazione all'interno di sottodomini o all'interno di un singolo dominio. Pertanto, i proprietari del sito possono specificare www.esempio.com invece di esempio.com O help.example.com, tuttavia, non può specificare esempio.com invece di esempio-widgets.com.

Sembra interessante, ma posso vedere un esempio?
Sì, wikia.com ci ha aiutato come tester di fiducia. Ad esempio, lo noterai fonte su http://starwars.wikia.com/wiki/Nelvana_Limited contiene rel=canonical http://starwars.wikia.com/wiki/Nelvana.

I due indirizzi sono quasi identici, tranne per il fatto che Nelvana_Limited, il primo URL, contiene un breve messaggio accanto al titolo. Questo è un buon esempio di utilizzo del tag in futuro. Con rel=canonical, le proprietà dei due indirizzi vengono unite ei risultati della ricerca mostrano la versione corretta.

Se hai domande sull'utilizzo del nuovo tag, puoi porle nei commenti sul blog ufficiale di Google Webmaster.

1. Oltre a eliminare i contenuti duplicati naturali (a causa della mancanza di motore), eliminiamo anche i contenuti duplicati artificiali quando i concorrenti cercano di infastidirci aggiungendo parametri arbitrari all'URL nelle pagine.

2. Ora non c'è bisogno di utilizzare robots.txt per impedire l'indicizzazione di pagine come "versione stampata" e altri duplicati (ad esempio, in WordPress era necessario chiudere il percorso /teg/) e per accontentare ogni motore di ricerca separatamente (ci sono standard generali per robots.txt, ma ci sono anche una serie di caratteristiche del lavoro di ciascun motore di ricerca con questo file, quindi non potremmo prevedere il divieto di indicizzare alcune pagine contemporaneamente per tutti i bot).

3. Ora abbiamo buon strumento per velocizzare l'indicizzazione del sito 🙂

Gli URL canonici sono un mistero per molte persone e, come tali, molti potrebbero abusare di tali URL per impostare reindirizzamenti 301, ad esempio. Le persone presumono che questa funzione sia correlata alla SEO, ma non sanno quando e come usarla. In WordPress in particolare (rispetto a un normale sito HTML) può essere piuttosto difficile impostare manualmente l'URL canonico per ogni pagina del sito senza ricorrere ai plug-in a causa del lavoro dei modelli di temi disponibili nel sistema di gestione dei contenuti.

In questo articolo, ti aiuteremo a risolvere alcuni problemi degli utenti relativi agli URL canonici. Anche gli utenti non WordPress possono trovare utile questo articolo in quanto suggerisce i principi di base degli URL canonici che si applicano a qualsiasi sistema di gestione dei contenuti o metodo di sviluppo.

Tieni presente che questo articolo può sembrare abbastanza scoraggiante per te se non hai competenze tecniche relative a WordPress, HTML di base o SEO. Ti presenteremo prima i termini di base. Se all'improvviso qualcosa nell'articolo ti sembra incomprensibile, puoi sempre cercare nel motore di ricerca le risposte alle tue domande.

Cos'è un URL canonico?

L'URL canonico (spesso descritto come rel=canonical, canonical tag, ecc.) è quello che i motori di ricerca usano quando fanno riferimento al materiale sul tuo sito quando la pagina del materiale ha più versioni sul tuo sito o anche sul web. Oggi, gli URL canonici vengono utilizzati per risolvere alcuni dei complicati problemi di contenuto duplicato e talvolta questa capacità viene utilizzata per impostare reindirizzamenti 301.

Google offre un'ottima spiegazione dello scopo degli URL canonici. Consiglio vivamente di studiarlo. Lo hanno reso il più chiaro possibile.

Forse pensi che il tuo sito non abbia contenuti duplicati. È fantastico se fai attenzione che i tuoi contenuti non vengano ripetuti pagine diverse. In caso contrario, potrebbe verificarsi una diminuzione dei risultati della ricerca.

Se decidi di duplicare il testo sul tuo sito, pensaci seriamente: se tu fossi un motore di ricerca che cerca di rispondere alla domanda di un utente, offriresti all'utente due pagine identiche nelle SERP? NO! È inutile per le persone. Invece, offriresti tutte le SERP che riesci a trovare, il che soddisferebbe di conseguenza le esigenze di ricerca delle persone.

Quindi, se hai contenuti duplicati sul tuo sito, puoi - e dovresti - aspettarti che Google non classifichi tutte le tue pagine. Tuttavia, questo non è eccezionale se stai pensando solo alle metriche dei motori di ricerca e alla presenza nelle SERP.

URL duplicati che potresti non conoscere

Ottimo, torniamo indietro e supponiamo di aver verificato che le pagine del nostro sito siano uniche. Tuttavia, potresti comunque ritrovarti con alcuni URL duplicati "nascosti" che semplicemente non conosci (ovviamente non sono realmente nascosti). Questo potrebbe sorprenderti, ma dovresti sapere che i motori di ricerca vedono i seguenti URL come completamente separati, anche se mostrano lo stesso contenuto:

  • http://www.examplesite.com (nota il www?)
  • http://sitodiesempio.com
  • https://examplesite.com (noti l'https?)
  • http://www.examplesite.com/ (noti la barra alla fine?)
  • http://sitodiesempio.com/index.php

Questo è il motivo per cui abbiamo bisogno di URL canonici nel tag HEAD del codice HTML di tutte le tue pagine. Devi dire ai motori di ricerca quale versione di tutti gli URL sopra (e altre versioni) dovrebbero visualizzare.

Sì, devi prendere la decisione finale se utilizzare www o meno in tutti i tuoi collegamenti nel tuo processo di web marketing. Dovresti attenersi alla stessa strategia di collegamento in tutto il sito e anche oltre. Tutti coloro che utilizzano i tuoi URL devono saperlo: dipendenti, partner, directory in cui sei elencato, persone che si collegano a te, tutti.

Devi anche decidere se utilizzare una barra alla fine dell'URL e se utilizzare https (se accetti Informazioni importanti come i dati della carta di credito). Scegli un'opzione e rispettala. Se fossi in te, sceglierei quello che viene utilizzato più spesso per evitare il mal di testa di correggere i miei URL.

Fortunatamente, se usi WordPress, la maggior parte di questi problemi può essere risolta. Esamineremo diversi plugin e altre cose che ti aiuteranno ad affrontare questo problema.

Tuttavia, ci sono altri luoghi in cui gli URL canonici sono molto utili.

Contenuti duplicati generati dalle tassonomie

Diciamo che stai scrivendo un articolo e includi quell'articolo in più categorie di blog con tag diversi in WordPress (questi sono tutti chiamati tassonomie). La gente lo fa sempre. Oppure supponiamo che tu sia un'azienda di e-commerce e che i tuoi prodotti vengano visualizzati in più categorie. Abbiamo un problema: il contenuto può essere presentato più volte a diversi URL, il che rende più facile per gli utenti navigare nel sito. Per esempio:

  • http://examplesite.com/store/candy/chocolate-truffles
  • http://examplesite.com/store/foods/chocolate-truffles

Vuoi che i tuoi utenti siano in grado di trovare i tartufi di cioccolato in due categorie: "caramelle" e "cibo". Questo è meraviglioso. Ma quale dei due URL dovrebbe essere indicizzato dai motori di ricerca? Ricorda che non classificheranno entrambi gli URL. Quindi, devi sceglierlo tu stesso. È qui che entrano in gioco gli URL canonici. Tali URL diranno ai motori di ricerca: “Ehi, questo contenuto è esattamente uguale a quello dell'altra pagina; per favore indicizzalo."

Ricorda che nessun motore di ricerca è obbligato a obbedire a questa canonicalizzazione e potrebbero ignorarla se la ritengono errata.

Utilizzo di URL cross-canonical durante la duplicazione di contenuti da altri siti

C'è il motivo più importante per cui hai bisogno di un URL canonico. Ne parleremo di seguito (ce ne sono altri, ma sono più complessi, mentre il principio è lo stesso). A volte pubblichi contenuti sul tuo sito che appaiono anche su altri siti. L'esempio più semplice di tale situazione è la sindacazione (ad esempio, i comunicati stampa).

Supponiamo che la tua azienda pubblichi un comunicato stampa e lo carichi sul tuo sito web. Questo è abbastanza normale. Tuttavia, i comunicati stampa funzionano così: possono essere utilizzati gratuitamente da qualsiasi editore di contenuti. Sono specificamente progettati per essere copiati e distribuiti. Esistono persino intere reti di syndication, come PRWeb. Questa è una forma abbastanza vecchia di marketing.

Tuttavia, crea problemi con la SEO. Per un robot di un motore di ricerca, il contenuto di un comunicato stampa sul tuo sito è esattamente lo stesso del contenuto di un comunicato stampa su altri siti di notizie. Come capire dov'è l'originale? Quale URL visualizzare nella SERP (risultati di ricerca)? Ricorda: devi sceglierlo.

Di solito, i motori di ricerca lo scelgono da soli se non offri loro nulla. E tale offerta viene fatta utilizzando l'URL canonico. Nel caso dei comunicati stampa, tuttavia, è improbabile che ogni piccola rivista di notizie abbia un URL canonico che punta al tuo sito. Ricorda che molte persone semplicemente non lo sanno. Dubito che saranno pronti a indicare la fonte originale del contenuto e la codifica HTML appropriata. Dopotutto, pubblicano diversi articoli al giorno.

Pertanto, dovresti prenderti cura di questo sul tuo sito. Se fossi in te, userei l'URL canonico sulla pagina contenente il tuo comunicato stampa e mi collegherei a una copia di esso sulla principale rete di syndication in cui hai pubblicato l'articolo per la distribuzione. Ad esempio, puoi collegarti a una copia di un articolo su PRweb.com (se utilizzi quel servizio).

Se vuoi vedere un esempio dal vivo di una situazione che non coinvolge i comunicati stampa ma riguarda comunque gli URL canonici, diamo un'occhiata al seguente articolo che ho scritto per KISSmetrics un anno fa:

Poco dopo, Entrepreneur.com ha raccolto questo articolo perché aveva un accordo con KISSmetrics (ricordate, avevano il permesso!)

Ora abbiamo lo stesso contenuto disponibile a due URL. Tecnicamente, si tratta di contenuti duplicati, il che non va bene! Tuttavia, non aver paura. Se guardi il codice sorgente dell'articolo su Entreprenuer.com, troverai quanto segue:

Questo indica ai motori di ricerca dove è stato inviato il contenuto originale, il che è una buona idea. Rimuove anche i sospetti di furto di contenuti agli occhi degli spider dei motori di ricerca (che potrebbero non essere a conoscenza dei tuoi diritti legali per pubblicare il lavoro).

Tuttavia, non dovresti creare un intero sito composto da articoli di altre persone. In questo caso, è improbabile che l'URL canonico ti aiuti a classificare. Pertanto, non abusare di questa tattica.

Quando non è possibile utilizzare URL canonici per contenuti duplicati esterni

Voglio parlarne perché mi capita spesso di incontrare situazioni del genere. Se desideri visualizzare una descrizione dell'azienda o una biografia personale sul tuo sito web, non ti consiglio di utilizzare le stesse parole e frasi che usi sul tuo sito web. profili social o altrove sulla rete.

Se utilizzi la stessa descrizione che hai su LinkedIn o sulla tua pagina aziendale di Google Plus, stai essenzialmente duplicando i contenuti. Non utilizzare l'URL canonico nella pagina Informazioni e collega il tuo profilo ad esso rete sociale. La tua pagina Informazioni dovrebbe posizionarsi da sola. In tal caso, utilizzare la descrizione univoca per uso esterno. Lo faccio per tutti i miei clienti.

Come utilizzare gli URL canonici in WordPress

Ci sono diversi modi per farlo, ma ti mostrerò il migliore che uso io stesso: basta usare il plugin WordPress SEO di Joost De Valk.

Una volta installato questo plug-in sul tuo sito, ti consentirà di occuparti di numerose metriche SEO, inclusi gli URL canonici. Tuttavia, il plug-in offre altre impostazioni a cui devi prestare attenzione.

Nello screenshot qui sotto, puoi vederlo nella schermata di modifica per un singolo post o pagina (il plug-in funziona anche per i tipi di post personalizzati) Cruscotto WordPress SEO offre un sacco di impostazioni e campi. Per impostare URL canonici che puoi utilizzare per cose come comunicati stampa o contenuti duplicati esterni, vai alla scheda Avanzate:

Fai clic sul menu a discesa per selezionare il tipo di URL per l'indirizzo canonico nel tag head di tutte le tue pagine:

Quando non utilizzare l'URL canonico

Innanzitutto, leggi quanto segue sul blog di Google Webmaster Central sugli errori comuni con gli URL rel=canonical. Assicurati che tu o il tuo sviluppatore non li consentiate. In secondo luogo, non utilizzare URL canonici nelle seguenti situazioni:

Quando vuoi fare un reindirizzamento 301

Se desideri reindirizzare una pagina a un'altra in modo che gli utenti che immettono il vecchio URL o fanno clic su un collegamento non funzionante vengano reindirizzati al nuovo URL, devi utilizzare un reindirizzamento 301. Non utilizzare URL canonici per questo. Tuttavia, in SEO, vengono spesso applicati in questo modo.

Un reindirizzamento significa che c'è solo un posto in cui viene presentato il contenuto e stai costringendo gli utenti ad andare su quella pagina. Questo è adatto, ad esempio, se hai spostato il tuo sito in un nuovo dominio o hai impostato una nuova struttura dell'URL a causa di un rinnovamento del sito. Puoi anche utilizzare un reindirizzamento 301 per indirizzare le persone alla versione www o non www del tuo sito (questo assicura che nessuno vada al tuo sito all'indirizzo sbagliato).

Grazie agli URL canonici, puoi avere lo stesso contenuto su diverse pagine del Web e avere un'unica fonte di contenuto "originale". In altre parole, possono esistere ed essere visualizzate dagli utenti diverse pagine contenenti lo stesso contenuto.

Tuttavia, nel 2011, Rand Fishkin ha condotto un interessante esperimento in cui ha utilizzato l'URL canonico nell'intestazione di tutte le pagine di un vecchio dominio per migliorare il posizionamento di un altro nuovo dominio. E ha funzionato. Ha raccontato questa storia nella sua voce. La voce spiega anche perché gli URL canonici sono così importanti per la sindacazione di contenuti interdominio nel mondo SEO. Non credo che funzionerà oggi, ma puoi provarlo come esperimento.

Quando vuoi che i motori di ricerca ignorino la tua pagina

Ricorda che rel=canonical non è una soluzione ai problemi di contenuti duplicati. L'ottimizzazione per i motori di ricerca è molto più complicata e talvolta una soluzione migliore consiste nell'utilizzare un file robots per impedire l'indicizzazione delle pagine. È per questo plug-in WordPress La SEO include opzioni pertinenti.

Consiglio ai miei clienti di chiudere dall'indicizzazione alcune pagine che non sono utili per i visitatori. Ad esempio, perché hai bisogno di una pagina Termini e condizioni, una pagina di accesso? Non dovrebbero essere lì. Meglio far posto a contenuti di maggior valore. Ciò include pagine di vendita, descrizioni dei prodotti e post di blog informativi.

Raccomando anche di utilizzare la regola no-index per le pagine con pochissimi contenuti (perché il tuo sito sembra troppo sottile) e per gli archivi che hanno contenuti duplicati. In WordPress, questo vale per gli archivi degli autori, gli archivi delle date e, nel mio caso, gli archivi dei tag (poiché contengono lo stesso contenuto degli archivi delle categorie). Puoi anche disattivare l'indicizzazione dei tipi di post personalizzati e dei relativi archivi, a condizione che alimentino solo contenuti da altre pagine del tuo sito.

Nota: se stai bloccando qualcosa dall'indicizzazione, dovrai rimuovere anche questo contenuto dalla mappa del sito, altrimenti si verificheranno errori in Google Webmaster Tools.

Correggere l'URL in modo che corrisponda al suo puntatore canonico

Ricordi che abbiamo detto sopra sulla scelta di una versione dell'URL che verrà utilizzata in tutti i link d'ora in poi? Ottimo, una volta fatto ciò, dovrai "ripulire" o correggere gli URL sul tuo sito e altrove per puntare alla versione di tua scelta. Supponiamo che tu decida di utilizzare la versione non www del tuo sito. Ora devi assicurarti che tutti i collegamenti esterni e interni utilizzino la versione selezionata. In caso contrario, dovresti provare a modificare gli URL. Sì, può sembrare un'azione piuttosto complicata, ma ne vale la pena.

Per sostituire rapidamente tutti gli URL sul tuo sito, puoi utilizzare uno strumento come Search Replace DB. Tuttavia, usalo solo se capisci cosa stai facendo.

Ci sono anche plugin che ti permettono di cercare e sostituire tramite la console di WordPress. Dopo la sostituzione, rimuovi tutto ciò che è connesso al tuo database per evitare inutili rischi per la sicurezza.

Per gestire i link non funzionanti in post e pagine, usa un plug-in come Reindirizzamento per fare il lavoro per te.

Quando hai fatto tutto questo, assicurati di aver effettuato l'accesso al tuo account Google Strumenti per i Webmaster e imposta l'URL preferito per il tuo sito. Inoltre, invia entrambe le versioni www e non www del tuo sito a Google Webmaster Tools per impostare le preferenze.

Conclusione: utilizza URL canonici per vantaggi SEO

Speriamo di aver superato il caos che c'è stato intorno ai link canonici e al loro impatto sulla SEO. Se ancora non comprendi tutti gli aspetti, ti consiglio di seguire i link forniti in questo articolo. Tuttavia, il miglior risultato è che ora sai come utilizzare gli URL canonici, sapendo che hanno il potenziale per produrre ottimi risultati SEO.

Il contenuto duplicato è un problema che non tutti i proprietari di siti Web aziendali possono gestire. A volte semplicemente non hanno il tempo di affrontare il problema. Fortunatamente, i motori di ricerca comprendono che a volte è possibile accedere allo stesso contenuto da URL diversi e in modo abbastanza legale. I motori di ricerca ci hanno fornito uno strumento che possiamo utilizzare, quindi usiamolo a nostro vantaggio!

Il tag canonical (rel=”canonical”) è uno strumento piuttosto importante. Ottimizzazione del motore di ricerca. Spesso è anche meglio di un reindirizzamento 301 quando si tratta di contenuti duplicati.

Diamo un'occhiata più da vicino a questo tag.

Cosa c'è di sbagliato nei contenuti duplicati

Il contenuto duplicato è costituito da due documenti identici nel contenuto. Quando Google vede un duplicato, cerca di escluderlo dall'indice, perché in teoria, l'utente non vuole vedere più volte lo stesso documento nei risultati della ricerca. Inoltre, il motore di ricerca stesso non vuole elaborare costantemente migliaia e persino milioni di pagine duplicate, spendendo la sua capacità produttiva per questo.

Il problema per il webmaster è che se le stesse informazioni si trovano su pagine diverse, solo una di queste pagine apparirà nei risultati di ricerca. Ma l'url che Google sceglie non è sempre il più ottimale per l'utente, e non sempre è la fonte originale.

Fino a quando il motore di ricerca non determina la fonte originale, i risultati della ricerca non soddisferanno gli obiettivi dell'autore del contenuto originale. In questo caso, il tag canonico è di uso limitato, poiché coloro che rubano il tuo contenuto molto probabilmente non lo taggheranno.

D'altra parte, se si verifica la duplicazione sul tuo sito, il tag tornerà utile. Anche se il tuo sito ha collegamenti a contenuti duplicati, solo la pagina di origine originale avrà valore nelle SERP. Pertanto, anche se sono presenti collegamenti a più duplicati, solo una di queste pagine sarà considerata significativa per Google. E non si farà male.

Naturalmente, questa non è la migliore soluzione in termini di SEO. Ma questo non porterà ad alcuna sanzione da parte di Google.

Cos'è il tag rel="canonical".

Il tag ha la seguente sintassi: In questo modo Google e Bing capiranno che tutti i duplicati fanno riferimento all'indirizzo canonico specificato nel tag. Google ha un'idea chiara sull'uso di questo tag:

Sì, rel=”canonical” deve essere utilizzato solo per selezionare la pagina preferita durante la duplicazione (sono accettabili piccole differenze di contenuto).

In altre parole, usalo solo per gestire contenuti duplicati. Se lo usi per altri scopi, potresti essere catturato dallo spam dei motori di ricerca.

Problemi di contenuti duplicati

Implementa i tag in modo appropriato sul tuo sito. Questo ti salverà da problemi di contenuti duplicati, alcuni dei quali sono legati ai sistemi di gestione dei contenuti (CMS):

  1. Codici di monitoraggio. Alcuni sistemi richiedono di aggiungere variabili alla fine dell'URL per i backlink al tuo sito. Il formato può essere: www.example.com?tracking-variable o questo: www.example.com/example.htm?tracking-code. Il problema è che i motori di ricerca separano gli indirizzi anche se differiscono di un solo carattere. Sebbene Google e Bing dispongano di tecnologie per aiutare a determinare tali indirizzi, ci sono ancora molti errori nella loro elaborazione. Sarà interessante notare che alcuni link al tuo sito per ottenere un backlink reciproco utilizzando questo metodo. Il tag canonico ti proteggerà da questo.
  2. Prefissi all'URL. Come abbiamo già spiegato, due indirizzi qualsiasi che differiscono di almeno un carattere vengono trattati come pagine separate. E ci sono alcuni casi in cui i prefissi degli indirizzi possono portare a contenuti duplicati. Questi includono, ad esempio, una lingua aggiuntiva del sito (versioni russa e inglese della pagina) o la creazione di pagine aggiuntive da parte del motore (pronunciato in WordPress).
  3. Impaginazione. Questo è quando il sito viene automaticamente suddiviso in più pagine con lo stesso contenuto. Ad esempio, se si dispone di un negozio online e i prodotti possono essere ordinati in base al colore del prodotto o al prezzo (in questo caso, viene generata una pagina separata con le stesse descrizioni dei prodotti per il risultato dell'ordinamento).
  4. www. Per la maggior parte, questo non è un problema, poiché Google di solito determina correttamente gli indirizzi con e senza www. Ma succede ancora che il motore di ricerca indicizzi, per così dire, due versioni del sito (example.com e www.example.com). Di conseguenza, metà dei tuoi contenuti è indicizzata con www e l'altra metà è indicizzata senza www. Di solito questo caso è scritto in robot.txt, ma anche il tag canonical può essere d'aiuto.
  5. Se è impossibile implementare un reindirizzamento 301. Stranamente, in alcuni casi, il webmaster non ha l'opportunità di implementare reindirizzamenti 301, ad esempio a causa di accesso limitato al server. Il tag canonical è un'alternativa in questo caso, con l'unica differenza che la pagina originale continuerà ad esistere.

Tuttavia, in conformità con la politica di Google, il tag canonical è una raccomandazione, non una regola obbligatoria. Questa opzione aiuterà i proprietari del sito a specificare autonomamente quale pagina Google dovrebbe considerare come canonica. In questo modo, sarà più facile per Google determinare quale pagina indicizzare durante la duplicazione dei contenuti.

Buona giornata lettori. Per la maggior parte delle persone, gli URL canonici sono estremamente criptici e spesso possono essere utilizzati in modo improprio per cose come i reindirizzamenti 301. Gli utenti sanno che tali collegamenti sono correlati alla SEO, ma non sono del tutto sicuri di come possano essere utilizzati. Parlando di WordPress (al contrario di un sito HTML), non è così facile scrivere manualmente collegamenti canonici per ogni singola pagina del tuo sito senza utilizzare un plug-in, poiché va contro il modo in cui funziona il modello CMS.

Questo articolo aiuterà a chiarire alcune delle domande che gli utenti di WordPress potrebbero avere sull'utilizzo degli URL canonici. Non Utenti WordPress troveranno utile questo articolo anche perché possono apprendere i principi di base e quindi applicare queste regole al proprio sistema di gestione dei contenuti o arricchire la propria esperienza di sviluppatore. Tuttavia, se non hai una conoscenza tecnica di WordPress o una conoscenza di base di HTML e Search Engine Optimization (SEO), questo articolo potrebbe sembrare difficile da seguire. Abbiamo coperto tutti i termini in modo che tu possa conoscerli prima. Ma, in ogni caso, da questa pubblicazione si possono ricavare le basi necessarie da cui partire per cercare su google maggiori informazioni per avere un quadro più completo.

Cos'è un URL canonico?

L'URL canonico (noto anche come rel=canonical, tag canonical e altri nomi) è ciò a cui fanno riferimento i motori di ricerca quando vedono versioni duplicate di una pagina sul tuo sito o su Internet. Questa tecnica viene ora utilizzata per risolvere difficili problemi di contenuto duplicato, poiché spesso è una soluzione migliore rispetto all'utilizzo di un reindirizzamento 301.

Forse pensi che non ci siano contenuti duplicati sul tuo sito. Ed è fantastico se ti assicuri che i tuoi contenuti non si ripetano su più pagine. In caso contrario, il tuo sito potrebbe posizionarsi più in basso nei risultati di ricerca.

Se il tuo sito ha un testo duplicato, prova a pensare seriamente a questo problema: se tu fossi un motore di ricerca che prova a rispondere alla domanda di un utente, daresti a quell'utente due pagine identiche nelle SERP? Ovviamente no! È completamente inutile. Daresti loro così tanti risultati diversi (nelle SERP) che possono trovare ciò di cui hanno bisogno.

Pertanto, se il contenuto del tuo sito viene ripetuto più e più volte, ci si aspetta che Google semplicemente non classifichi tali pagine. E questo non va bene se vuoi occupare almeno alcune posizioni nei risultati di ricerca.

Collegamenti a contenuti duplicati di cui non sai nemmeno l'esistenza

Ok, ora torniamo indietro e assumiamo che tu abbia fatto tutto bene e sei sicuro che tutte le tue pagine siano assolutamente uniche. Ma forse ci sono URL duplicati "nascosti" sul tuo sito di cui non sai nulla (in effetti, non sono nascosti, li ho appena chiamati così). Questo potrebbe sorprenderti, ma sapevi che i motori di ricerca trattano i seguenti URL come completamente indipendenti, anche se per te sono uguali e visualizzano lo stesso contenuto?

http://www.examplesite.com (hai notato www?)

http://sitodiesempio.com

https://examplesite.com (Avviso https?)

http://www.examplesite.com/ (noti la barra alla fine?)

http://sitodiesempio.com/index.php

Ecco perché hai bisogno dell'URL canonico nel tag Codice HTML per tutte le tue pagine. Devi dire ai motori di ricerca quale versione dei tipi di URL sopra o altri dovrebbero guardare.

Ciò significa che devi decidere una volta per tutte se vuoi o meno smettere di usare www in tutti i link del tuo progetto web. Questa dovrebbe essere la tua strategia di collegamento sia all'interno che all'esterno del sito. E tutti coloro che utilizzano i tuoi URL dovrebbero saperlo: i freelance che lavorano per te, i tuoi partner, comproprietari e anche questo indirizzo dovrebbe essere indicato in tutte le directory in cui si trova il tuo sito. Inoltre, devi decidere se vuoi una barra alla fine o https (se il tuo sito ha informazioni specifiche inserite, come carte di credito). Scegli un'opzione e rispettala sempre. Se dipendesse da me scegliere, preferirei l'opzione più comunemente usata per ridurre il mal di testa quando si tratta di organizzare gli URL.

Fortunatamente, se lavori con WordPress, la maggior parte di questi problemi è abbastanza facile da risolvere. Ti parleremo dei plugin richiesti e dei passaggi da seguire più avanti in questo articolo.

Ma ancora una volta, ci sono molti altri usi per i collegamenti canonici.

Contenuti duplicati creati dalla tassonomia

Supponiamo che tu scriva un articolo e lo includa in diverse categorie e tag di blog in WordPress (questo è tutto chiamato tassonomia). La gente lo fa sempre. Oppure, ad esempio, hai un negozio online in cui i prodotti sono elencati in diverse categorie. Quindi, per impostazione predefinita, per comodità degli utenti che si spostano all'interno del sito, lo stesso contenuto viene visualizzato in URL diversi, ma ciò comporta problemi. Per esempio:

http://examplesite.com/store/candy/chocolate-truffles

http://examplesite.com/store/foods/chocolate-truffles

Vuoi che i visitatori trovino quei "tartufi di cioccolato" in entrambe le categorie: "dolci" e "cibo". Buona aspirazione. Ma quale URL dovrebbero cercare i motori di ricerca? Ricorda che non classificheranno entrambi i link. Quindi devi scegliere. È qui che i collegamenti canonici tornano utili. Diranno ai motori di ricerca "ehi, questa pagina ha lo stesso contenuto di quella, per favore classifica questa pagina, non quella".

Ricorda che si tratta di una richiesta: nessun motore di ricerca è obbligato a obbedire alla tua canonizzazione e potrebbe ignorarla se la ritenesse errata.

Utilizzo di un URL canonico interdominio per contenuti duplicati

Questo è l'ultimo motivo per cui hai bisogno dell'elemento URL canonico, di cui parleremo in questo articolo (ce ne sono altri, ma sono complessi, e il principio di utilizzo non cambia): quando pubblichi sul tuo sito dei contenuti che compaiono anche su altri siti. Gli esempi più evidenti di tale duplicazione sono i comunicati stampa. È così che la tua azienda pubblica un comunicato stampa e lo inserisce nel tuo sito web. È perfettamente legale. Ma, tradizionalmente, un comunicato stampa è qualcosa che chiunque può pubblicare da solo. Sono creati per essere condivisi e copiati. Ecco come funzionano le comunità di distribuzione come PRWeb. È uno stratagemma di marketing vecchio stile.

Ma questo crea un conflitto di interessi SEO. Per un robot di ricerca, il contenuto di un comunicato stampa sul tuo sito è lo stesso dei siti che lo hanno preso in prestito. Allora dov'è la copia originale? Quale link posizionare nei risultati di ricerca? Ricorda che devi solo sceglierne uno.

Di solito i motori di ricerca scelgono per te, a meno che tu non offra loro la tua scelta. E puoi farlo usando l'URL canonico. Nel caso dei comunicati stampa, tuttavia, è improbabile che ogni sito di notizie pubblichi il tuo articolo con un URL canonico alla tua risorsa. Ricorda che per molti questo elemento non è molto chiaro. Dubito anche che qualcuno si prenderebbe il tempo per trovare la risorsa con l'articolo originale e codificare correttamente il proprio codice HTML. Pubblicano più articoli al giorno, quindi solo tu puoi assicurarti di ottenere i link giusti sul tuo sito. Se fossi in te, inserirei l'URL canonico nella pagina che contiene il comunicato stampa e farei riferimento alla copia sulla pagina della grande comunità in cui hai originariamente pubblicato l'articolo da prendere in prestito. Ad esempio, carica una copia dell'articolo su PRweb.com (se usi questo servizio). Solo i miei cinque centesimi.

Ecco un esempio di vita reale, al di fuori della situazione del comunicato stampa, in cui l'URL canonico è tornato utile: dai un'occhiata a un articolo che ho scritto su KISSmetrics circa un anno fa:

Subito dopo, Entrepreneur.com ha ospitato questo articolo in quanto aveva un accordo con KISSmetrics.

Ecco l'URL di quell'articolo:

http://www.entrepreneur.com/article/231237

Ora abbiamo lo stesso contenuto, che porta a due collegamenti diversi. Tecnicamente si tratta di contenuto duplicato e il contenuto duplicato è "cattivo", ricordi? Ma non aver paura! Se guardi il codice sorgente di Entreprenuer.com lo vedrai

Questo dice ai motori di ricerca dove si trova il contenuto originale, che è la corretta via d'uscita.

Ciò elimina il sospetto di furto di contenuti agli occhi dei motori di ricerca (che altrimenti non potrebbero scoprire chi possiede esattamente i diritti legali per pubblicare i contenuti).

Probabilmente non vorrai avere un sito che pubblica solo i contenuti di altre persone. Qui è improbabile che l'elemento URL canonico ti aiuti a migliorare il posizionamento del sito. Quindi non abusare di questa tattica.

Quando non puoi utilizzare l'URL canonico per contenuti duplicati da un altro sito

Vorrei sottolineare un punto, poiché ho visto questa situazione molte volte. Se hai intenzione di scrivere una descrizione dell'azienda o una biografia personale sul tuo sito, non ti consiglierei di utilizzare lo stesso insieme di parole sui tuoi profili di social media o su qualsiasi altro sito. Se scrivi la stessa cosa più e più volte sulla tua pagina aziendale di LinkedIn, sulla pagina aziendale di Google Plus, ecc., stai semplicemente duplicando i tuoi contenuti. Non sarai in grado di utilizzare un URL canonico su una pagina su un'azienda o una persona e collegarti a un profilo di social media: non vuoi che quella pagina si posizioni da sola. In questo caso, scrivi ogni volta una nuova descrizione univoca.

Come utilizzare gli URL canonici in WordPress

Si può fare diversi modi ma te ne parlerò L'opzione migliore, che conosco: usa il plugin di Joost De Valk. Una volta installata questa estensione sul tuo sito, si occuperà della tua SEO, inclusa la gestione degli URL canonici per quelli che ho chiamato URL "nascosti" (vedi sopra). Ma vale comunque la pena prestare attenzione ad alcune impostazioni. Nello screenshot qui sotto, puoi vedere la schermata di configurazione per un singolo post o pagina (applicabile anche per i tipi di post personalizzati se li usi) e la casella SEO di WordPress contiene molti campi e impostazioni. Per impostare gli URL canonici, utili per cose come comunicati stampa e contenuti duplicati su altri siti, fai clic sulla scheda "Avanzate":

Questo plug-in semplificherà notevolmente l'elemento URL canonico per te. Tutto quello che devi fare è inserire l'URL completo della fonte originale del tuo contenuto pubblicato su questa pagina. In altre parole, l'URL che copia il contenuto è il collegamento che dovrebbe utilizzare l'URL canonico nell'intestazione HTML. Il contenuto copiato ora segnalerà ai motori di ricerca che si tratta solo di una copia. Ha senso, vero?

Ok, ma questo è solo un principio. Sulla base dell'esempio sopra riportato, a volte potresti voler indicare che stai solo copiando il contenuto, anche se non è affatto così, poiché è semplicemente difficile per te controllare la distribuzione del contenuto. Puoi pubblicare il comunicato stampa sul sito Web della tua azienda e, se lo desideri, puoi utilizzare l'attributo per la fonte di contenuto originale nella rete di syndication che utilizzi. In questo senso, agirai come uno dei sindacati. (A proposito, questa è solo la mia opinione. Questo suggerimento potrebbe non essere approvato da altri esperti SEO. Quindi usalo a tuo rischio e pericolo. Google "giura" che è molto bravo a identificare la fonte originale del contenuto e i puntatori canonici sono solo ulteriore aiuto, i motori di ricerca potrebbero ignorarli).

In altri casi, gli URL canonici inseriti saranno collegamenti interni al tuo sito con contenuti duplicati. Diciamo, ad esempio, che pubblichi la descrizione del tuo prodotto su una pagina di vendita all'ingrosso statica. Ma stai usando la stessa descrizione nella sezione del tuo sito in cui le persone acquistano al dettaglio.

Utilizzando il campo dell'URL canonico nelle impostazioni SEO di WordPress, puoi dire ai motori di ricerca per quale link desideri che si posizionino.

Commento: È necessario selezionare la versione www o non www del collegamento per ciascuna pagina utilizzando queste impostazioni. Il plug-in SEO di WordPress lo fa automaticamente. Potresti aver bisogno di queste impostazioni solo se l'URL è molto diverso o se il contenuto si trova su un dominio diverso.

Impostazione di un URL canonico globale https utilizzando WordPress SEO

Ecco un'altra cosa che puoi fare con i link canonici usando il plugin SEO di WordPress. Se stai utilizzando certificati SSL (per la vendita online) puoi fare in modo che il tuo tag canonico utilizzi la versione https dei tuoi collegamenti nel caso in cui le pagine possano essere sia http che https. Per fare ciò, vai su SEO > Permalink e scorri verso il basso fino a "Impostazioni canoniche" nella dashboard di WordPress.

Fai clic sul menu a discesa in cui puoi selezionare il tipo di URL che desideri rendere l'elemento URL canonico nel tag tutte le tue pagine:

Al fine di promuovere adeguatamente le pagine del sito in motori di ricerca, devi dire ai robot quali URL sono più preferibili per entrare nell'indice. Questo viene impostato utilizzando tag speciali.

Cos'è rel canonico?

Diamo un'occhiata più da vicino al tag rel="canonical". Il suo obiettivo principale è combattere le pagine duplicate e le pagine non informative (ad esempio le pagine di impaginazione), nonché migliorare la qualità dell'indicizzazione prescrivendo un indirizzo prioritario.

Avevo un sito web con un crawl budget limitato. Cioè, in effetti c'erano 10mila pagine, ma nell'indice potevano esserci solo 2mila (perché il sito era giovane e non fidato). Di conseguenza, quelle pagine di cui avevo bisogno nell'indice spesso non ci arrivavano. Il canonico ha aiutato: l'inserimento del canonico dalle pagine di impaginazione agli URL principali ha permesso di far capire chiaramente ai motori di ricerca quali pagine dovrebbero essere nell'indice.

Che cos'è un collegamento canonico?

Il tag canonical sarà estremamente utile se il tuo sito ha pagine duplicate disponibili a URL diversi. Con esso, è necessario prescrivere un URL canonico prioritario per la percezione da parte dei motori di ricerca.

Ciò che è importante: verranno trasmessi anche il peso del collegamento e altre caratteristiche della pagina (PageRank, ecc.).

Questo attributo è specificato all'interno del tag su URL duplicati con un URL preferito. È formattato in questo modo:

A cosa serve il canonico?

Se ci sono pagine simili, tutte vengono indicizzate contemporaneamente dai motori di ricerca. Di conseguenza, nessuno di essi è completamente promosso a causa del fatto che esistono collegamenti interni a entrambe le pagine. Il motore di ricerca non sa a quale dare la priorità.

Lo stesso vale per i collegamenti esterni: non viene promosso un URL, ma diversi e anche il peso è distribuito tra di loro. E il sito è in posizioni più basse di quanto potrebbe essere.

Grazie al canonico, l'indice del motore di ricerca avrà un URL canonico preferito.

Esempi di utilizzo

Ad esempio, hai una versione stampata di una pagina sul tuo sito. O un URL separato per versione mobile. E metti un canonico da loro nella pagina principale, di conseguenza, questa pagina principale ottiene più peso e un vantaggio durante la classifica e un mucchio di spazzatura viene rimosso dall'indice.

Come canonico viene utilizzato per l'impaginazione

Devi inserire rel canonical dalle pagine di impaginazione (site.ru/category/page/2) alla prima di esse (site.ru/category).

Le opinioni sull'impostazione dell'impaginazione variano: alcuni esperti affermano che è necessario chiudere tutte le pagine di impaginazione dai motori di ricerca, altri che è meglio lasciarle a disposizione dei robot dei motori di ricerca.

Yandex consiglia di impostare un collegamento canonico alla prima pagina da tutte le pagine di impaginazione. Di conseguenza, il robot Yandex percepirà che è la prima pagina che deve essere indicizzata. In merito all'indicizzazione delle merci, si precisa che Yandex seguirà comunque altri link.

Gli specialisti di Google tendono alle seguenti opzioni:

  1. lascia tutto come prima: il motore di ricerca riconosce e percepisce diversi tipi di pagine in modo diverso;
  2. crea un URL "Mostra tutto" separato e impostalo come canonico, particolarmente consigliato per articoli multipagina;
  3. aggiungere gli attributi rel="prev" e rel="next" al tag link per correggere la relazione tra gli URL; Il motore di ricerca restituirà il primo.

Ed ecco il video di Devaki, dove spiega in dettaglio l'impaginazione:

attributi rel="next" e rel="prev".

C'è anche un'altra opinione: non è necessario chiudere le pagine di paginazione, al contrario, dovrebbero ricevere traffico aggiuntivo. E due cose sono importanti qui:

  • Tutti gli URL devono avere un parametro tag title univoco, testo univoco e meta tag;
  • Se sei più orientato a Google, allora è consigliato l'uso obbligatorio degli attributi rel="next" e rel="prev", che devono essere configurati in modo che ogni pagina precedente si colleghi alla successiva. L'URL del successivo è impostato sull'indirizzo root, l'URL del precedente e quello successivo su quelli successivi, e solo quello precedente sull'ultimo.

Puoi prescrivere l'impaginazione con questi tag e posizionare il collegamento canonico sul primo o su pagina iniziale- a seconda delle caratteristiche della risorsa.

Tema con impaginatore SEO

Diciamo che uno dei blog (Sawynih o qualcosa del genere, non ricordo più) ha scritto di un caso in cui le pagine di impaginazione hanno dato traffico aggiuntivo.

Se un prodotto simile appare su URL diversi, la navigazione può essere impostata nei seguenti modi:

  1. Scrivi automaticamente valori di parametro univoci, raccogliendo intestazioni da parti separate, ad esempio:

    (compra|ordina|acquista) gonne in (saratov|rostov|astrakhan) (a basso prezzo|redditizio|economico) con uno sconto (nel negozio|nel negozio online)

    Verranno generati valori di meta tag univoci.

  2. Il più efficace e dispendioso in termini di tempo è la prescrizione indipendente di questi parametri, manualmente. Tutti i titoli saranno unici e molto diversi tra loro, anche nel significato. Ciò ti consentirà di promuovere ogni URL a bassa frequenza e poco competitivo interrogazioni chiave nei primi risultati dei motori di ricerca. Grazie all'uso di questo metodo, il nucleo semantico si espanderà. Inoltre, è anche inappropriato scrivere molti articoli per un negozio online.

È importante eseguire questo lavoro una volta individualmente per ogni URL. I parametri saranno fissati dai motori di ricerca.

Configurazione di Canonical per WordPress

Molti plugin di WordPress funzionano alla grande con questo tag.

La maggior parte di essi è facile da usare: attiviamo il plug-in e i collegamenti canonici vengono aggiunti automaticamente. In altri plugin SEO, è sufficiente selezionare la casella accanto a questo parametro nelle impostazioni. Se un articolo appartiene a diverse categorie contemporaneamente, il collegamento canonico viene corretto in modo indipendente.

Quando si utilizza il plug-in Yoast SEO e si inserisce il post in diverse categorie, il motore di ricerca vedrà solo una pagina.

Cos'altro è utile sapere su Canonical?

È importante sottolineare i seguenti punti:

  1. Il tag canonical non è una direttiva, ma un suggerimento che dovrebbe essere preso in considerazione e analizzato, evidenziando l'URL più appropriato per i risultati di ricerca.
  2. Per quanto riguarda la progettazione dei collegamenti canonici, non esiste un momento proibitivo sotto forma di percorso relativo. Anche se viene introdotto il tag con un collegamento a un documento, i percorsi relativi verranno trattati come specificato nell'URL di base.
  3. Le pagine canoniche potrebbero non contenere esattamente lo stesso contenuto, e questo è logico. Possono essere presenti piccole differenze.
  4. Anche se si verifica un errore 404, il contenuto verrà indicizzato. Tuttavia, si consiglia di specificare gli URL funzionanti come canonici.
  5. Se l'URL canonico non è stato ancora indicizzato, c'è ancora un'attesa, di solito non per molto. Quando viene riconosciuto, il suggerimento verrà rivisto.
  6. Puoi utilizzare un reindirizzamento: il motore di ricerca accetterà il reindirizzamento e terrà conto di un indirizzo diverso.
  7. Si consiglia di impostare lo stesso tag rel canonical per il miglior risultato di canonicalizzazione.
  8. L'URL canonico può essere scritto solo dal dominio corrente. Per specificare un URL da un altro dominio, devi utilizzare un reindirizzamento 301.
  9. Come sono formattati gli URL canonici può essere studiato sull'esempio del sito wikia.com aprendo il codice sorgente della pagina http://starwars.wikia.com/wiki/Nelvana_Limited, contenente l'URL canonico http://starwars.wikia .com/wiki/Nelvana
    Entrambi i collegamenti sono quasi uguali, ma il primo ha l'attributo canonical e Google visualizzerà la versione specificata in questo parametro.
  10. Le domande sull'uso dei canonici possono essere poste sul blog ufficiale per i webmaster del motore di ricerca Google.

In questo caso, il canonico è apposto alla pecora nera

Vantaggi associati alla possibilità di impostare correttamente l'indicizzazione utilizzando il tag canonical:

  • eliminare contenuti simili associati alle carenze del motore, nonché azioni mirate create artificialmente dai concorrenti;
  • non è necessario utilizzare robots.txt per impedire l'indicizzazione delle singole pagine e accontentare tutti i motori di ricerca.