Enlaces canónicos (rel="canonical"). Nueva etiqueta rel=canonical para eliminar páginas duplicadas etiqueta rel canonical

Si su sitio tiene contenido idéntico o muy similar disponible en diferentes URL, entonces el nuevo formato le permitirá especificar qué URL debe devolverse en el motor de búsqueda. También puede estar seguro de que todas las características, como la equidad de enlace, etc. se transferirá a la versión correcta de la dirección.

Ahora puede agregar esta etiqueta para indicar la versión de su dirección dentro de la etiqueta en páginas con contenido duplicado:

De esta forma, Google entenderá que todos los duplicados se refieren a la dirección canónica especificada en la etiqueta. Las propiedades de dirección adicionales, como PageRank y las señales relacionadas, también se transferirán de las páginas duplicadas a la especificada.

Dicha etiqueta será útil principalmente cuando se usen varios motores (phpBB, IPB, WordPress, etc., por ejemplo, el sitio ipbskins.ru - desarrollo de diseño de sitios web en IPB, debe usar un archivo robots.txt largo para evitar la duplicación contenido), creando muchas páginas similares, por ejemplo, estas pueden ser páginas:

versión impresa del artículo:
http://site.ru/article01.html?print=true
versión de texto de artículos para mob. Los telefonos:
http://site.ru/lofiversion/article01.html
Duplicado por falta de motor:
http://site.ru/articles/?id=1&category=new
http://site.ru/articles/?id=1&tag=palabra clave
y varios mas...

Este estándar puede ser adaptado por cualquier motor de búsqueda al indexar un sitio.

Para el popular motor de blogs WordPress, ya se ha desarrollado un complemento canónico que inserta una etiqueta en las páginas deseadas. Otros motores populares para blogs, foros, tiendas en línea, etc. también ampliará su funcionalidad en un futuro próximo (estén atentos).

Respuestas a algunas preguntas populares sobre la etiqueta:

¿Es rel="canonical" una pista o una directiva?
Esta es una pista que tenemos en cuenta y, en interacción con otras señales, calculamos la página más relevante para mostrar en los resultados de búsqueda.

¿Puedo usar una ruta relativa para especificar canonical así: ?
Sí, las rutas relativas se reconocen de la misma manera que en una etiqueta normal . Incluso si ingresa la etiqueta con un enlace al documento, las rutas relativas se considerarán de acuerdo con la URL base.

¿Está bien si las URL canónicas contienen menos que contenido completamente duplicado?
Permitimos pequeñas diferencias, como el orden de clasificación en la tabla de productos. También entendemos que el robot puede analizar las direcciones canónicas en diferentes momentos, por lo que todo esto es normal.

¿Qué pasa si rel="canonical" devuelve un error 404?
Continuaremos indexando su contenido y usando heurística para determinar la dirección canónica; sin embargo, le recomendamos que use las URL existentes como URL canónicas.

¿Qué sucede si rel="canonical" aún no está indexado?
Intentamos llegar a la URL canónica rápidamente. Tan pronto como lo indexamos, inmediatamente reconsideramos la sugerencia rel="canonical".

¿Puede una URL canónica contener una redirección?
Sí, puede especificar una redirección, en cuyo caso el motor de búsqueda procesará el proceso de redirección como de costumbre e intentará indexar la nueva dirección.

¿Qué pasa si tengo señales contradictorias para rel="canonical"?
Nuestros algoritmos son suaves: podemos seguir cadenas canónicas; sin embargo, le recomendamos enfáticamente que especifique una única dirección canónica en sus páginas para garantizar resultados de canonicalización óptimos.

¿Podría esta etiqueta de enlace sugerir una dirección canónica en un dominio completamente diferente?
No. Para migrar a otro dominio es más apropiado. Actualmente, Google admite la canonicalización dentro de subdominios o dentro de un solo dominio. Por lo tanto, los propietarios del sitio pueden especificar www.ejemplo.com en lugar de ejemplo.com o ayuda.ejemplo.com, sin embargo, no puede especificar ejemplo.com en lugar de ejemplo-widgets.com.

Suena interesante, pero ¿puedo ver un ejemplo?
Sí, wikia.com nos ayudó como probador de confianza. Por ejemplo, notarás que fuente en http://starwars.wikia.com/wiki/Nelvana_Limited contiene rel=canonical http://starwars.wikia.com/wiki/Nelvana.

Las dos direcciones son casi idénticas, excepto que Nelvana_Limited, la primera URL, contiene un mensaje corto junto al título. Este es un buen ejemplo del uso de la etiqueta en el futuro. Con rel=canonical, las propiedades de las dos direcciones se fusionan y los resultados de la búsqueda muestran la versión correcta.

Si tiene alguna pregunta sobre el uso de la nueva etiqueta, puede hacerla en los comentarios del blog oficial para webmasters de Google.

1. Además de deshacernos del contenido duplicado natural (debido a la falta de motor), también nos deshacemos del contenido duplicado artificial cuando los competidores intentan molestarnos agregando parámetros arbitrarios a la URL en las páginas.

2. Ya no hace falta usar robots.txt para evitar la indexación de páginas como “versión impresa” y otros duplicados (por ejemplo, en WordPress era necesario cerrar la ruta /teg/) y complacer a cada motor de búsqueda por separado (existen estándares generales para robots.txt, pero también hay una serie de características del trabajo de cada motor de búsqueda con este archivo, por lo que no podríamos prever la prohibición de indexar algunas páginas a la vez para todos los bots).

3. Ahora tenemos buena herramienta para acelerar la indexación del sitio 🙂

Las URL canónicas son un misterio para muchas personas y, como tales, muchos pueden hacer un mal uso de dichas URL para configurar redireccionamientos 301, por ejemplo. La gente asume que esta función está relacionada con el SEO, pero no saben cuándo ni cómo usarla. En WordPress en particular (en comparación con un sitio HTML normal) puede ser bastante difícil configurar manualmente la URL canónica para cada página del sitio sin recurrir a los complementos debido al trabajo de las plantillas de temas disponibles en el sistema de administración de contenido.

En este artículo, ayudaremos a resolver algunos problemas de los usuarios relacionados con las URL canónicas. Los usuarios que no son de WordPress también pueden encontrar útil este artículo, ya que sugerirá los principios básicos de las URL canónicas que se aplican a cualquier sistema de gestión de contenido o método de desarrollo.

Tenga en cuenta que este artículo puede parecer bastante abrumador para usted si no tiene habilidades técnicas relacionadas con WordPress, HTML básico o SEO. Le presentaremos primero los términos básicos. Si de repente algo en el artículo le parece incomprensible, siempre puede buscar en el motor de búsqueda las respuestas a sus preguntas.

¿Qué es una URL canónica?

La URL canónica (a menudo descrita como rel=canonical, etiqueta canónica, etc.) es lo que usan los motores de búsqueda cuando se refieren al material en su sitio cuando la página del material tiene múltiples versiones en su sitio o incluso en la web. Hoy en día, las URL canónicas se usan para resolver algunos de los problemas complicados de contenido duplicado y, a veces, esta capacidad se usa para establecer redireccionamientos 301.

Google ofrece una excelente explicación del propósito de las URL canónicas. Recomiendo mucho estudiarlo. Lo dejaron lo más claro posible.

Quizás pienses que tu sitio no tiene contenido duplicado. Es genial si cuidas que tu contenido no se repita en paginas diferentes. De lo contrario, puede resultar en una disminución en los resultados de búsqueda.

Si decide duplicar texto en su sitio, piénselo seriamente: si fuera un motor de búsqueda que intentara responder la consulta de un usuario, ¿le ofrecería al usuario dos páginas idénticas en las SERP? ¡No! Es inútil para la gente. En su lugar, ofrecería tantos SERP como pueda encontrar, lo que se adaptaría a las necesidades de búsqueda de las personas en consecuencia.

Por lo tanto, si tiene contenido duplicado en su sitio, puede, y debe, esperar que Google no clasifique todas sus páginas. Sin embargo, esto no es bueno si solo está pensando en las métricas del motor de búsqueda y la presencia SERP.

URL duplicadas que quizás no conozcas

Genial, regresemos y supongamos que nos hemos asegurado de que las páginas de nuestro sitio sean únicas. Sin embargo, aún puede terminar con algunas URL duplicadas "ocultas" que simplemente no conoce (en realidad no están ocultas, por supuesto). Esto puede sorprenderte, pero debes saber que los motores de búsqueda ven las siguientes URL como completamente separadas, incluso si muestran el mismo contenido:

  • http://www.examplesite.com (¿observa el www?)
  • http://sitiodeejemplo.com
  • https://examplesite.com (¿observa el https?)
  • http://www.examplesite.com/ (¿observa la barra inclinada al final?)
  • http://sitioejemplo.com/index.php

Esta es la razón por la que necesitamos URL canónicas en la etiqueta HEAD del código HTML de todas sus páginas. Debe informar a los motores de búsqueda qué versión de todas las URL anteriores (y otras versiones) deben ver.

Sí, tiene que tomar la decisión final sobre si va a utilizar www o no en todos sus enlaces en su proceso de marketing web. Debe apegarse a la misma estrategia de enlaces en todo el sitio, e incluso más allá. Todos los que usan sus URL deben saber esto: empleados, socios, directorios en los que aparece, personas que se vinculan con usted, todos.

También debe decidir si usará una barra inclinada al final de la URL y si usará https (si acepta información importante como la información de la tarjeta de crédito). Elige una opción y apégate a ella. Si yo fuera usted, elegiría el que se usa con más frecuencia para evitar el dolor de cabeza de arreglar mis URL.

Afortunadamente, si usa WordPress, la mayoría de estos problemas se pueden resolver. Veremos diferentes complementos y otras cosas que lo ayudarán a lidiar con esto.

Sin embargo, hay otros lugares donde las URL canónicas son muy útiles.

Contenido duplicado generado por taxonomías

Digamos que está escribiendo un artículo e incluye ese artículo en varias categorías de blog con diferentes etiquetas en WordPress (todas se denominan taxonomías). La gente siempre lo hace. O supongamos que tiene una empresa de comercio electrónico y sus productos aparecen en varias categorías. Tenemos un problema: el contenido se puede presentar varias veces en diferentes URL, lo que facilita a los usuarios navegar por el sitio. Por ejemplo:

  • http://examplesite.com/store/candy/chocolate-trufas
  • http://examplesite.com/store/foods/chocolate-truffles

Desea que sus usuarios puedan encontrar trufas de chocolate en dos categorías: "dulces" y "comida". Está bien. Pero, ¿cuál de las dos URL debería ser indexada por los motores de búsqueda? Recuerde que no clasificarán ambas URL. Por lo tanto, debe elegir esto usted mismo. Aquí es donde entran en juego las URL canónicas. Tales URL le dirán a los motores de búsqueda: “Oye, este contenido es exactamente el mismo que el de la otra página; por favor indícelo".

Recuerda que ningún motor de búsqueda está obligado a obedecer esta canonicalización, y pueden ignorarla si la consideran incorrecta.

Uso de URL canónicas cruzadas al duplicar contenido de otros sitios

Existe la razón más importante por la que necesita una URL canónica. Hablaremos de ello a continuación (hay otros, pero son más complejos, mientras que el principio es el mismo). A veces, publica contenido en su sitio que también aparece en otros sitios. El ejemplo más simple de tal situación es la sindicación (por ejemplo, comunicados de prensa).

Supongamos que su empresa publica un comunicado de prensa y lo sube a su sitio web. Esto es bastante normal. Sin embargo, los comunicados de prensa funcionan así: son de uso gratuito para cualquier editor de contenido. Están diseñados específicamente para ser copiados y distribuidos. Incluso existen redes de sindicación completas, como PRWeb. Esta es una forma bastante antigua de marketing.

Sin embargo, crea problemas con el SEO. Para un robot de motor de búsqueda, el contenido de un comunicado de prensa en su sitio es exactamente el mismo que el contenido de un comunicado de prensa en otros sitios de noticias. ¿Cómo entender dónde está el original? ¿Qué URL mostrar en SERP (resultados de búsqueda)? Recuerda: debes elegirlo.

Por lo general, los motores de búsqueda lo eligen por su cuenta si no les ofreces nada. Y dicha oferta se realiza utilizando la URL canónica. Sin embargo, en el caso de los comunicados de prensa, es poco probable que todas las revistas de noticias pequeñas tengan una URL canónica que apunte a su sitio. Recuerde que muchas personas simplemente no lo saben. Dudo que se apresuren a señalar la fuente original del contenido y la codificación HTML adecuada. Después de todo, publican varios artículos diferentes al día.

Por lo tanto, debe ocuparse de esto en su sitio. Si yo fuera usted, usaría la URL canónica en la página que contiene su comunicado de prensa y vincularía una copia del mismo en la red de sindicación principal donde publicó el artículo para su distribución. Por ejemplo, puede enlazar a una copia de un artículo en PRweb.com (si usa ese servicio).

Si desea ver un ejemplo en vivo de una situación que no involucra comunicados de prensa pero que aún afecta las URL canónicas, echemos un vistazo al siguiente artículo que escribí para KISSmetrics hace un año:

Poco después, Entrepreneur.com retomó este artículo porque tenían un acuerdo con KISSmetrics (recuerda, ¡tenían permiso!)

Ahora tenemos el mismo contenido disponible en dos URL. Técnicamente, esto es contenido duplicado, ¡lo cual es malo! Sin embargo, no tengas miedo. Si observa el código fuente del artículo en Entreprenuer.com, encontrará lo siguiente:

Esto le dice a los motores de búsqueda dónde se envió el contenido original, lo cual es una buena idea. También elimina las sospechas de robo de contenido a los ojos de las arañas de los motores de búsqueda (que pueden no saber acerca de sus derechos legales para publicar el trabajo).

Sin embargo, no debe crear un sitio completo que consista en artículos de otras personas. En este caso, es poco probable que la URL canónica lo ayude a clasificar. Por lo tanto, no abuses de esta táctica.

Cuando no puede usar URL canónicas para contenido duplicado externo

Quiero hablar de esto porque a menudo me encuentro con este tipo de situaciones. Si desea mostrar una descripción de la empresa o una biografía personal en su sitio web, no recomiendo usar las mismas palabras y frases que usa en su sitio web. perfiles sociales o en cualquier otro lugar de la red.

Si usa la misma descripción que tiene en LinkedIn o en su página comercial de Google Plus, entonces esencialmente está duplicando contenido. No use la URL canónica en la página Acerca de y vincule su perfil a ella desde red social. Tu página Acerca de debe posicionarse por sí sola. En tal caso, utilice la descripción única para uso externo. Hago esto para todos mis clientes.

Cómo usar URL canónicas en WordPress

Hay varias formas de hacer esto, pero te voy a mostrar la mejor que yo mismo uso: solo usa el complemento WordPress SEO de Joost De Valk.

Una vez que instale este complemento en su sitio, le permitirá cuidar numerosas métricas de SEO, incluidas las URL canónicas. Sin embargo, el complemento ofrece otras configuraciones a las que debe prestar atención.

En la captura de pantalla a continuación, puede ver eso en la pantalla de edición para una sola publicación o página (el complemento también funciona para tipos de publicaciones personalizadas) Tablero de WordPress SEO ofrece una tonelada de configuraciones y campos. Para configurar direcciones URL canónicas que puede usar para cosas como comunicados de prensa o contenido duplicado externo, vaya a la pestaña Avanzado:

Haga clic en el menú desplegable para seleccionar el tipo de URL para la dirección canónica en la etiqueta principal de todas sus páginas:

Cuándo no usar la URL canónica

Primero, lea lo siguiente en el blog del Centro para webmasters de Google sobre errores comunes con URL rel=canonical. Asegúrese de que usted, o su desarrollador, no los permita. En segundo lugar, no use URL canónicas en las siguientes situaciones:

Cuando quieres hacer una redirección 301

Si desea redirigir una página a otra para que los usuarios que ingresen la URL anterior o hagan clic en un enlace inactivo sean redirigidos a la nueva URL, debe usar una redirección 301. No use URL canónicas para esto. Sin embargo, en SEO, a menudo se aplican de esta manera.

Una redirección significa que solo hay un lugar donde se presenta el contenido y estás obligando a los usuarios a ir a esa página. Esto es adecuado, por ejemplo, si movió su sitio a un nuevo dominio o si configuró una nueva estructura de URL debido a una renovación del sitio. También puede usar una redirección 301 para enviar a las personas a la versión www o no www de su sitio (esto asegura que nadie vaya a su sitio en la dirección incorrecta).

Gracias a las URL canónicas, puede tener el mismo contenido en diferentes páginas de la web y tener una fuente de contenido "original". En otras palabras, diferentes páginas que contienen el mismo contenido pueden existir y ser vistas por los usuarios.

Sin embargo, en 2011, Rand Fishkin hizo un experimento interesante en el que usó la URL canónica en el encabezado de todas las páginas de un dominio antiguo para mejorar la clasificación de otro dominio nuevo. Y funcionó. Contó esta historia en su entrada. La entrada también explica por qué las URL canónicas son tan importantes para la sindicación de contenido entre dominios en el mundo del SEO. No creo que funcione hoy, pero puedes intentarlo como un experimento.

Cuando quieres que los motores de búsqueda ignoren tu página

Recuerda que rel=canonical no es una solución para los problemas de contenido duplicado. La optimización de motores de búsqueda es mucho más complicada y, a veces, una mejor solución es usar un archivo robots para evitar que las páginas se indexen. Es por eso Complemento de WordPress SEO incluye opciones relevantes.

Recomiendo que mis clientes cierren algunas páginas de la indexación que no son útiles para los visitantes. Por ejemplo, ¿por qué necesita una página de Términos y condiciones, una página de inicio de sesión? No deberían estar allí. Es mejor dar paso a contenido más valioso. Esto incluye páginas de ventas, descripciones de productos y publicaciones de blog informativas.

También recomiendo usar la regla de no indexación para páginas con muy poco contenido (porque su sitio se ve demasiado delgado) y para archivos que tienen contenido duplicado. En WordPress, esto se aplica a los archivos de autor, archivos de fecha y, en mi caso, archivos de etiquetas (porque contienen el mismo contenido que los archivos de categoría). También puede optar por no indexar tipos de publicaciones personalizadas y sus archivos, siempre que solo alimenten contenido de otras páginas de su sitio.

Nota: si está bloqueando la indexación de algo, también deberá eliminar este contenido del mapa del sitio; de lo contrario, se producirán errores en las Herramientas para webmasters de Google.

Arreglando la URL para que coincida con su puntero canónico

¿Recuerda que dijimos anteriormente sobre elegir una versión de la URL que se usará en todos los enlaces a partir de ahora? Genial, una vez que haya hecho eso, deberá "limpiar" o corregir las URL en su sitio y en otros lugares para apuntar a la versión de su elección. Supongamos que decide utilizar la versión sin www de su sitio. Ahora debe asegurarse de que todos los enlaces externos e internos usen la versión que seleccionó. De lo contrario, debe intentar cambiar las URL. Sí, esto puede parecer una acción bastante complicada, pero vale la pena.

Para reemplazar rápidamente todas las URL en su sitio, puede usar una herramienta como Search Replace DB. Sin embargo, úsalo solo si entiendes lo que estás haciendo.

También hay complementos que le permiten buscar y reemplazar a través de la consola de WordPress. Después del reemplazo, elimine todo lo que esté conectado a su base de datos para evitar riesgos de seguridad innecesarios.

Para lidiar con enlaces muertos en publicaciones y páginas, use un complemento como Redirección para hacer el trabajo por usted.

Cuando haya hecho todo esto, asegúrese de haber iniciado sesión en su cuenta Google Herramientas para webmasters y establezca la URL preferida para su sitio. Además, envíe las versiones www y no www de su sitio a las Herramientas para webmasters de Google para establecer preferencias.

Conclusión: use URL canónicas para obtener beneficios de SEO

Con suerte, hemos superado el caos que ha habido en torno a los enlaces canónicos y su impacto en el SEO. Si aún no comprende todos los aspectos, le recomiendo que siga los enlaces proporcionados en este artículo. Sin embargo, el mejor logro es que ahora sabe cómo usar las URL canónicas, sabiendo que tienen el potencial de producir excelentes resultados de SEO.

El contenido duplicado es un problema que no todos los propietarios de sitios web comerciales pueden manejar. A veces simplemente no tienen tiempo para lidiar con el problema. Afortunadamente, los motores de búsqueda entienden que a veces se puede acceder al mismo contenido desde diferentes URL y de manera bastante legal. Los motores de búsqueda nos han dado una herramienta que podemos usar, ¡así que aprovechémosla!

La etiqueta canónica (rel=”canonical”) es una herramienta bastante importante. optimización de motores de búsqueda. A menudo es incluso mejor que una redirección 301 cuando se trata de contenido duplicado.

Echemos un vistazo más de cerca a esta etiqueta.

¿Qué tiene de malo el contenido duplicado?

El contenido duplicado son dos documentos que son idénticos en contenido. Cuando Google ve un duplicado, intenta excluirlo del índice porque en teoría, el usuario no quiere ver el mismo documento en los resultados de búsqueda varias veces. Y además, el propio buscador no quiere procesar constantemente miles e incluso millones de páginas duplicadas, gastando en ello su capacidad de producción.

El problema para el webmaster es que si la misma información está en diferentes páginas, solo una de estas páginas aparecerá en los resultados de búsqueda. Pero la url que elige Google no siempre es la más óptima para el usuario, y no siempre es la fuente original.

Hasta que el motor de búsqueda determine la fuente original, los resultados de la búsqueda no satisfarán los objetivos del autor del contenido original. En este caso, la etiqueta canónica tiene un uso limitado, ya que quienes roban tu contenido probablemente no lo etiquetarán.

Por otro lado, si se produce una duplicación en su sitio, la etiqueta será útil. Incluso si su sitio tiene enlaces a contenido duplicado, solo la página de origen original tendrá valor en los SERP. Por lo tanto, incluso si hay enlaces a varios duplicados, solo una de estas páginas se considerará significativa para Google. Y no se lastimará.

Naturalmente, esta no es la mejor solución en términos de SEO. Pero esto no dará lugar a ninguna sanción por parte de Google.

¿Qué es la etiqueta rel=”canonical”?

La etiqueta tiene la siguiente sintaxis: De esta forma, Google y Bing entenderán que todos los duplicados se refieren a la dirección canónica especificada en la etiqueta. Google tiene una idea clara sobre el uso de esta etiqueta:

Sí, rel=”canonical” solo debe usarse para seleccionar la página preferida al duplicar (se aceptan diferencias menores en el contenido).

En otras palabras, úsalo solo para lidiar con contenido duplicado. Si lo usa para otros fines, puede verse atrapado en el spam del motor de búsqueda.

Problemas de contenido duplicado

Implemente las etiquetas adecuadamente en su sitio. Esto lo salvará de problemas de contenido duplicado, algunos de los cuales están relacionados con los sistemas de administración de contenido (CMS):

  1. Códigos de seguimiento. Algunos sistemas requieren que agregue variables al final de la URL para los vínculos de retroceso a su sitio. El formato puede ser: www.example.com?tracking-variable o este: www.example.com/example.htm?tracking-code. El problema es que los motores de búsqueda separan las direcciones incluso si difieren en un solo carácter. Aunque Google y Bing tienen tecnologías a su disposición para ayudar a determinar dichas direcciones, todavía hay muchos errores en su procesamiento. Será interesante notar que algunos vinculan a su sitio para obtener un vínculo de retroceso mutuo utilizando este método. La etiqueta canónica te protegerá de esto.
  2. Prefijos a la URL. Como ya hemos explicado, dos direcciones cualesquiera que difieran en al menos un carácter se tratan como páginas separadas. Y hay algunos casos en los que los prefijos de dirección pueden generar contenido duplicado. Estos incluyen, por ejemplo, un idioma adicional del sitio (versiones en ruso e inglés de la página) o la creación de páginas adicionales por parte del motor (pronunciado en WordPress).
  3. Paginación. Esto es cuando el sitio se divide automáticamente en varias páginas con el mismo contenido. Por ejemplo, si tiene una tienda en línea y los productos se pueden ordenar por el color del producto o por su precio (en este caso, se genera una página separada con las mismas descripciones de productos para el resultado de la ordenación).
  4. www. En su mayor parte, esto no es un problema, ya que Google suele determinar correctamente las direcciones con y sin www. Pero aún sucede que el motor de búsqueda indexa, por así decirlo, dos versiones del sitio (example.com y www.example.com). Como resultado, la mitad de su contenido se indexa con www y la otra mitad se indexa sin www. Por lo general, este caso se escribe en robot.txt, pero la etiqueta canónica también puede ayudar aquí.
  5. Si es imposible implementar una redirección 301. Curiosamente, en algunos casos, el webmaster no tiene la oportunidad de implementar redireccionamientos 301, por ejemplo, debido a acceso limitado al servidor La etiqueta canónica es una alternativa en este caso, con la única diferencia de que la página original seguirá existiendo.

Pero aún así, de acuerdo con la política de Google, la etiqueta canónica es una recomendación, no una regla obligatoria. Esta opción ayudará a los propietarios de sitios a especificar de forma independiente qué página debe considerar Google como canónica. De esta manera, será más fácil para Google determinar qué página indexar al duplicar contenido.

Buenos días lectores. Para la mayoría de las personas, las URL canónicas son extremadamente crípticas y, a menudo, pueden usarse indebidamente para cosas como redireccionamientos 301. Los usuarios saben que dichos enlaces están relacionados con el SEO, pero no están del todo seguros de cómo se pueden utilizar. Hablando de WordPress (a diferencia de un sitio HTML), no es tan fácil escribir manualmente enlaces canónicos para cada página de su sitio sin usar un complemento, ya que va en contra de la forma en que funciona la plantilla CMS.

Este artículo ayudará a aclarar algunas de las preguntas que los usuarios de WordPress pueden tener sobre el uso de URL canónicas. No Usuarios de WordPress También encontrarán útil este artículo porque pueden aprender los principios básicos y luego aplicar estas reglas a su propio sistema de administración de contenido o enriquecer su experiencia de desarrollador. Sin embargo, si no tiene conocimientos técnicos de WordPress o conocimientos básicos de HTML y optimización de motores de búsqueda (SEO), este artículo puede parecerle difícil de seguir. Hemos cubierto todos los términos para que pueda conocerlos primero. Pero, en cualquier caso, desde esta publicación puedes sacar las bases necesarias desde las que puedes empezar a googlear para encontrar más información para hacerte una idea más completa.

¿Qué es una URL canónica?

La URL canónica (también conocida como rel=canonical, etiqueta canónica y otros nombres) es a lo que se refieren los motores de búsqueda cuando ven versiones duplicadas de una página en su sitio o en Internet. Esta técnica ahora se usa para resolver problemas difíciles de contenido duplicado, ya que a menudo es una mejor solución que usar una redirección 301.

Quizás piense que no hay contenido duplicado en su sitio. Y eso es excelente si se asegura de que su contenido no se repita en varias páginas. De lo contrario, puede hacer que su sitio tenga una clasificación más baja en los resultados de búsqueda.

Si su sitio tiene texto duplicado, intente pensar seriamente en este problema: si fuera un motor de búsqueda que intentara responder la consulta de un usuario, ¿le daría a ese usuario dos páginas idénticas en las SERP? ¡Por supuesto no! Es completamente inútil. Les daría tantos resultados diferentes (en las SERP) que pueden encontrar lo que necesitan.

Por lo tanto, si el contenido de su sitio se repite una y otra vez, se espera que Google simplemente no clasifique dichas páginas. Y esto no es bueno si quieres ocupar al menos algunas posiciones en los resultados de búsqueda.

Enlaces a contenido duplicado que ni siquiera sabes que existe

Bien, ahora regresemos y supongamos que hizo todo bien y está seguro de que todas sus páginas son absolutamente únicas. Pero quizás haya direcciones URL duplicadas "ocultas" en su sitio de las que no sepa nada (de hecho, no están ocultas, simplemente las llamé así). Esto puede sorprenderte, pero ¿sabías que los motores de búsqueda tratan las siguientes URL como completamente independientes, aunque sean iguales para ti y muestren el mismo contenido?

http://www.examplesite.com (¿viste www?)

http://sitiodeejemplo.com

https://examplesite.com (¿Aviso https?)

http://www.examplesite.com/ (¿observa la barra inclinada al final?)

http://sitioejemplo.com/index.php

Por eso necesitas la URL canónica en la etiqueta. Código HTML para todas sus páginas. Debe decirles a los motores de búsqueda qué versión de los tipos de URL anteriores u otros deberían mirar.

Esto significa que debes decidir de una vez por todas si quieres o no dejar de usar www en todos los enlaces de tu proyecto web. Esta debería ser su estrategia de vinculación tanto dentro como fuera del sitio. Y todos los que usan sus URL deben saber esto: los trabajadores independientes que trabajan para usted, sus socios, copropietarios, y también esta dirección debe indicarse en todos los directorios donde se encuentra su sitio. Además, debe decidir si desea una barra al final o https (si su sitio tiene información específica ingresada, como tarjetas de crédito). Elige una opción y apégate a ella en todo momento. Si dependiera de mí elegir, preferiría la opción más utilizada para reducir el dolor de cabeza a la hora de organizar las URL.

Afortunadamente, si está trabajando con WordPress, la mayoría de estos problemas son bastante fáciles de solucionar. Le informaremos sobre los complementos necesarios y los pasos a seguir más adelante en este artículo.

Pero, de nuevo, hay muchos más usos para los enlaces canónicos.

Contenido duplicado creado por taxonomía

Supongamos que escribe un artículo y lo incluye en diferentes categorías y etiquetas de blog en WordPress (todo esto se llama taxonomía). La gente lo hace todo el tiempo. O, por ejemplo, tienes una tienda en línea en la que los productos se enumeran en diferentes categorías. Entonces, por diseño, para la comodidad de los usuarios que se mueven por el sitio, el mismo contenido aparece en diferentes URL, pero esto genera problemas. Por ejemplo:

http://examplesite.com/store/candy/chocolate-trufas

http://examplesite.com/store/foods/chocolate-truffles

Desea que los visitantes encuentren esas "trufas de chocolate" en ambas categorías: "dulces" y "comida". Buena aspiración. Pero, ¿qué URL deben buscar los motores de búsqueda? Recuerda que no rankearán ambos enlaces. Así que tienes que elegir. Aquí es donde los enlaces canónicos son útiles. Le dirán a los motores de búsqueda "oye, esta página tiene el mismo contenido que esa, clasifica esta página, no esa".

Recuerda que esto es una solicitud: ningún motor de búsqueda está obligado a obedecer tu canonicalización y pueden ignorarla si la consideran incorrecta.

Uso de una URL canónica entre dominios para contenido duplicado

Esta es la última razón por la que necesita el elemento URL canónico, que se tratará en este artículo (hay otros, pero son complejos y el principio de uso no cambia): cuando publica contenido en su sitio que también aparece en otros sitios Los casos más obvios de tal duplicación son los comunicados de prensa. Así es como su empresa publica un comunicado de prensa y lo coloca en su sitio web. Es perfectamente legal. Pero, tradicionalmente, un comunicado de prensa es algo que cualquiera puede publicar por su cuenta. Están creados para ser compartidos y copiados. Así funcionan las comunidades de distribución como PRWeb. Es una estratagema de marketing anticuada.

Pero esto crea un conflicto de intereses de SEO. Para un robot de búsqueda, el contenido de un comunicado de prensa en su sitio es el mismo que en los sitios que lo tomaron prestado. Entonces, ¿dónde está la copia original? ¿Qué enlace clasificar en los resultados de búsqueda? Recuerda que solo tienes que elegir uno.

Por lo general, los motores de búsqueda eligen por usted, a menos que les ofrezca su elección. Y puedes hacerlo usando la URL canónica. Sin embargo, en el caso de los comunicados de prensa, es poco probable que todos los sitios de noticias publiquen su artículo con una URL canónica a su recurso. Recuerda que para muchos este elemento no está muy claro. También dudo que alguien se tome el tiempo de encontrar el recurso con el artículo original y codificar su HTML correctamente. Publican varios artículos al día, por lo que solo usted puede asegurarse de obtener los enlaces correctos en su sitio. Si yo fuera usted, pondría la URL canónica en la página que contiene el comunicado de prensa y me referiría a la copia en la página de la gran comunidad donde publicó originalmente el artículo para pedirlo prestado. Por ejemplo, cargue una copia del artículo en PRweb.com (si usa este servicio). Solo mis cinco centavos.

Aquí hay un ejemplo de la vida real, fuera de la situación del comunicado de prensa, donde la URL canónica resultó útil: eche un vistazo a un artículo que escribí sobre KISSmetrics hace aproximadamente un año:

Poco después, Entrepreneur.com alojó este artículo ya que tenían un acuerdo con KISSmetrics.

Aquí está la URL de ese artículo:

http://www.entrepreneur.com/article/231237

Ahora tenemos el mismo contenido, lo que lleva a dos enlaces diferentes. Técnicamente, eso es contenido duplicado, y el contenido duplicado es "malo", ¿recuerdas? ¡Pero no tengas miedo! Si miras el código fuente de Entreprenuer.com verás esto

Esto le dice a los motores de búsqueda dónde se encuentra el contenido original, cuál es la salida correcta.

Esto elimina la sospecha de robo de contenido a los ojos de los motores de búsqueda (que de otro modo no pueden averiguar quién posee exactamente los derechos legales para publicar contenido).

Probablemente no le gustaría tener un sitio que solo publique contenido de otras personas. En este caso, es poco probable que el elemento URL canónico le ayude a mejorar la clasificación del sitio. Así que no abuses de esta táctica.

Cuando no puede usar la URL canónica para contenido duplicado de otro sitio

Me gustaría resaltar un punto, ya que he visto esta situación muchas veces. Si va a escribir una descripción de la empresa o una biografía personal en su sitio, no le recomendaría que use el mismo conjunto de palabras en sus perfiles de redes sociales o en cualquier otro sitio. Si escribe lo mismo una y otra vez en la página de su empresa de LinkedIn, la página de negocios de Google Plus, etc., simplemente está duplicando su contenido. No podrá usar una URL canónica en una página sobre una empresa o persona y vincular a un perfil de redes sociales: no desea que esa página se clasifique por sí sola. En este caso, escriba una nueva descripción única cada vez.

Cómo usar URL canónicas en WordPress

Se puede hacer diferentes caminos pero te hablaré de la mejor opción, que sé: use el complemento de Joost De Valk. Una vez que instale esta extensión en su sitio, se encargará de su SEO, incluida la administración de URL canónicas para lo que he llamado URL "ocultas" (ver arriba). Pero aún así vale la pena prestar atención a algunas configuraciones. En la captura de pantalla a continuación, puede ver la pantalla de configuración para una sola publicación o página (también aplicable para tipos de publicaciones personalizadas si las usa), y el cuadro SEO de WordPress contiene muchos campos y configuraciones. Para configurar URL canónicas, que son útiles para cosas como comunicados de prensa y contenido duplicado en otros sitios, haga clic en la pestaña "Avanzado":

Este complemento simplificará en gran medida el elemento URL canónico para usted. Todo lo que necesita hacer es ingresar la URL completa de la fuente original de su contenido que se publica en esta página. En otras palabras, la URL que copia el contenido es el enlace que debe usar la URL canónica en el encabezado HTML. El contenido copiado ahora indicará a los motores de búsqueda que es solo una copia. Tiene sentido, ¿verdad?

Está bien, pero eso es sólo un principio. Basándose en el ejemplo anterior, es posible que en ocasiones desee indicar que solo está copiando contenido, aunque no es así en absoluto, ya que simplemente le resulta difícil controlar la distribución del contenido. Puede publicar el comunicado de prensa en el sitio web de su empresa y, si lo desea, puede utilizar el atributo para la fuente de contenido original en la red de sindicación que utilice. En este sentido, actuará como uno de los sindicadores. (Por cierto, esta es solo mi opinión. Es posible que este consejo no esté aprobado por otros expertos en SEO. Así que utilícelo bajo su propio riesgo. Google "jura" que es muy bueno para identificar la fuente original del contenido, y los punteros canónicos son solo ayuda adicional, los motores de búsqueda pueden ignorarlos).

En otros casos, las URL canónicas que ingrese serán enlaces internos en su sitio con contenido duplicado. Digamos, por ejemplo, que publica la descripción de su producto en una página mayorista estática. Pero está utilizando esa misma descripción en la sección de su sitio donde la gente compra al por menor.

Al usar el campo de URL canónica en la configuración de SEO de WordPress, puede decirle a los motores de búsqueda qué enlace le gustaría que clasifiquen.

Comentario: Debe seleccionar la versión www o no www del enlace para cada página utilizando esta configuración. El complemento SEO de WordPress hace esto automáticamente. Es posible que solo necesite esta configuración si la URL es muy diferente o el contenido está en un dominio diferente.

Configuración de una URL canónica global https usando WordPress SEO

Aquí hay otra cosa que puede hacer con los enlaces canónicos usando el plugin SEO de WordPress. Si está utilizando certificados SSL (para vender en línea), puede hacer que su etiqueta canónica use la versión https de sus enlaces en caso de que las páginas puedan ser tanto http como https. Para hacerlo, ve a SEO > Enlaces permanentes y desplázate hacia abajo hasta "Configuración canónica" en tu Panel de WordPress.

Haga clic en el menú desplegable donde puede seleccionar el tipo de URL que desea que sea el elemento de URL canónica en la etiqueta todas tus paginas:

Para promocionar adecuadamente las páginas del sitio en los motores de búsqueda, debe decirle a los robots qué URL son más preferibles para ingresar al índice. Esto se establece mediante etiquetas especiales.

¿Qué es rel canónico?

Echemos un vistazo más de cerca a la etiqueta rel="canonical". Su objetivo principal es combatir las páginas duplicadas y las páginas no informativas (por ejemplo, las páginas de paginación), así como mejorar la calidad de la indexación prescribiendo una dirección prioritaria.

Tenía un sitio web con un presupuesto de rastreo limitado. Es decir, en realidad había 10 mil páginas, pero solo podía haber 2 mil en el índice (porque el sitio era joven y no era de confianza). Como resultado, las páginas que necesitaba en el índice a menudo no llegaban. El canonical ayudó: colocar el canonical de las páginas de paginación en las URL principales hizo posible que los motores de búsqueda entendieran claramente qué páginas deberían estar en el índice.

¿Qué es un enlace canónico?

La etiqueta canónica será extremadamente útil si su sitio tiene páginas duplicadas que están disponibles en diferentes URL. Con él, debe prescribir una URL canónica de prioridad para la percepción de los motores de búsqueda.

Lo que es importante: también se transmitirá el peso del enlace y otras características de la página (PageRank, etc.).

Este atributo se especifica dentro de la etiqueta. en URL duplicadas con una URL preferida. Está formateado así:

¿Para qué es canónico?

Si hay páginas similares, todas ellas son indexadas simultáneamente por los motores de búsqueda. Como resultado, ninguno de ellos se promociona por completo debido a que hay enlaces internos a ambas páginas. El buscador no sabe a cuál priorizar.

Lo mismo se aplica a los enlaces externos: no se promociona una URL, sino varias, y el peso también se distribuye entre ellas. Y el sitio está en posiciones más bajas de lo que podría estar.

Gracias a la canónica, el índice del motor de búsqueda tendrá una URL canónica preferida.

Ejemplos de uso

Por ejemplo, tiene una versión impresa de una página en su sitio. O una URL separada para version móvil. Y pones un canónico de ellos en la página principal, como resultado, esta página principal tiene más peso y una ventaja al clasificar, y se elimina un montón de basura del índice.

Cómo se usa canonical para la paginación

Debe poner rel canonical desde las páginas de paginación (site.ru/category/page/2) a la primera de ellas (site.ru/category).

Las opiniones sobre la configuración de la paginación varían: algunos expertos dicen que es necesario cerrar todas las páginas de paginación de los motores de búsqueda, otros que es mejor dejarlas disponibles para los robots de los motores de búsqueda.

Yandex recomienda configurar un enlace canónico a la primera página desde todas las páginas de paginación. Como resultado, el robot Yandex percibirá que es la primera página que debe indexarse. Sobre la indexación de bienes, se especifica que Yandex seguirá otros enlaces.

Los especialistas de Google tienden a las siguientes opciones:

  1. deje todo como antes: el motor de búsqueda reconoce y percibe diferentes tipos de páginas de manera diferente;
  2. cree una URL "Mostrar todo" separada y configúrela como canónica, especialmente recomendada para artículos de varias páginas;
  3. agregue los atributos rel="prev" y rel="next" a la etiqueta del enlace para corregir la relación entre las URL; El motor de búsqueda devolverá el primero.

Y aquí está el video de Devaki, donde explica en detalle sobre la paginación:

Atributos rel="next" y rel="prev"

También hay otra opinión, como que las páginas de paginación no necesitan cerrarse, por el contrario, deberían recibir tráfico adicional. Y dos cosas son importantes aquí:

  • Todas las URL deben tener un parámetro de etiqueta de título único, texto único y metaetiquetas;
  • Si está más orientado a Google, entonces se recomienda el uso obligatorio de los atributos rel="next" y rel="prev", que deben configurarse para que cada página anterior enlace con la siguiente. La URL de la siguiente se establece en la dirección raíz, la URL de la anterior y la siguiente en las siguientes, y solo la anterior en la última.

Puede prescribir la paginación con estas etiquetas y colocar el enlace canónico en la primera o en página de inicio- en función de las características del recurso.

Tema con paginador SEO

Digamos que uno de los blogs (Sawynih o algo así, ya no recuerdo) escribió sobre un caso en el que las páginas de paginación dieron tráfico adicional.

Si un producto similar aparece en diferentes URL, la navegación se puede configurar de las siguientes maneras:

  1. Escriba valores de parámetros únicos automáticamente, recopilando encabezados de partes separadas, por ejemplo:

    (comprar|pedir|comprar) faldas en (saratov|rostov|astrakhan) (a bajo precio|rentable|barato) con descuento (en la tienda|en la tienda en línea)

    Se generarán valores de metaetiqueta únicos.

  2. La más efectiva y que requiere más tiempo es la prescripción independiente de estos parámetros, manualmente. Todos los títulos serán únicos y muy diferentes entre sí, incluso en significado. Esto le permitirá promocionar cada URL en sitios poco competitivos y de baja frecuencia. consultas clave en los primeros resultados del motor de búsqueda. Gracias al uso de este método, el núcleo semántico se expandirá. Además, tampoco es apropiado escribir muchos artículos para una tienda en línea.

Es importante hacer este trabajo una vez individualmente para cada URL. Los parámetros serán fijados por los motores de búsqueda.

Configuración de Canonical para WordPress

Muchos complementos de WordPress funcionan muy bien con esta etiqueta.

La mayoría de ellos son fáciles de usar: activamos el complemento y los enlaces canónicos se agregan automáticamente. En otros complementos de SEO, basta con marcar la casilla junto a este parámetro en la configuración. Si un artículo pertenece a diferentes categorías al mismo tiempo, el enlace canónico se fija de forma independiente.

Al usar el complemento Yoast SEO y colocar la publicación en diferentes categorías, el motor de búsqueda solo verá una página.

¿Qué más es útil saber sobre Canonical?

Es importante recalcar los siguientes puntos:

  1. La etiqueta canónica no es una directiva, sino una pista que debe tenerse en cuenta y analizarse, destacando la URL más adecuada para los resultados de búsqueda.
  2. En cuanto al diseño de enlaces canónicos, no existe un momento prohibitivo en forma de ruta relativa. Incluso si se introduce la etiqueta con un enlace a un documento, las rutas relativas se tratarán como se especifica en la URL base.
  3. Las páginas canónicas pueden no tener exactamente el mismo contenido, y esto es lógico. Pueden existir pequeñas diferencias.
  4. Incluso si hay un error 404, el contenido se indexará. Sin embargo, se recomienda que especifique las URL de trabajo como canónicas.
  5. Si la URL canónica aún no se ha indexado, todavía hay una espera, generalmente no por mucho tiempo. Cuando se reconozca, se revisará la sugerencia.
  6. Puede usar una redirección: el motor de búsqueda aceptará la redirección y tendrá en cuenta una dirección diferente.
  7. Se recomienda establecer la etiqueta canónica rel idéntica para obtener el mejor resultado de canonicalización.
  8. La URL canónica solo se puede escribir desde el dominio actual. Para especificar una URL de otro dominio, debe usar una redirección 301.
  9. El formato de las URL canónicas se puede estudiar en el ejemplo del sitio wikia.com abriendo el código fuente de la página http://starwars.wikia.com/wiki/Nelvana_Limited, que contiene la URL canónica http://starwars.wikia .com/wiki/Nelvana
    Ambos enlaces son casi iguales, pero el primero tiene el atributo canónico, y Google mostrará la versión especificada en este parámetro.
  10. Las preguntas sobre el uso de canonicals se pueden hacer en el blog oficial para webmasters del motor de búsqueda de Google.

En este caso, el canónico se adjunta a la oveja negra.

Beneficios asociados con la capacidad de configurar correctamente la indexación utilizando la etiqueta canónica:

  • deshacerse de contenido similar asociado con las deficiencias del motor, así como las acciones intencionales de los competidores creadas artificialmente;
  • no es necesario usar robots.txt para evitar la indexación de páginas individuales y complacer a todos los motores de búsqueda.