Canonicalization issues?

Once again “Canonicalization” has become a hot topic within the SEO community given the recent addition and standardization of the “canonical tag” by all of the search engines. Recently I have been working on projects focused on the hispanic community and I have stumbled into a lot of websites with “Canonicalization Issues” that’s why I have written a much longer post regarding this on my “Spanish” section.

In the Anglo community these problems seem to be a bit more difficult to come cross, given that much more information is out there. For that reason below I have gathered some really nice articles regarding “Canonicalization”, the “Canonical Tag” issues and “other Canonical conflicts”.

What is “Canonicalization”?
Jane and Robot
Bruce Clay
Sugar Rae

What is the “Canonical Tag”?
Seo Gadget
Search Engine Land

Other issues regarding the use of the “Canonical Tag”
Matt Cutts
Helen Moverland

Hope these links can help you clear your doubts regarding the use of canonical tags and canonicalization. I’ll be adding more, if I stumble into more.Durante años he estado realizando análisis de estructuras de sitios web, he notado ultimamente que en la comunidad hispano hablante existen cada vez mayor numero de sitios que presentan problemas de Canonicalización. Es por eso que he decidido escribir este post, esperando poder ayudar a muchos dueños de sitios a identificarlos y por supuesto a solucionarlos!

¿Que es “Canonicalización”?

“Canonicalización es el proceso de escoger el mejor URL cuando hay diferentes opciones de URL’s”

Básicamente, en la mayoría de los casos muchos sitios web tendrán varios URL’s para la misma página, por ejemplo:

http://www.tu-sitio.com

http://tu-sitio.com

Estos dos URL’s te dirigen a la misma página, en este caso a la página de inicio. También podrían haber comprado otros dominios o tener otras páginas dentro del sitio, como: “http://www.tu-sitio.com.gt” o “http://www.tu-sitio.com/index.html” que de igual forma lleven a la misma página web. En este caso, esto significa que tengo cuatro URL’s que me dirigen a la misma página web.

¿Cuál es el problema de tener configurado mi sitio de este modo?

Bueno existen dos grandes consecuencias al tener problemas de Canonicalización como la descrita arriba:

  • Tu autoridad de enlace será directamente afectada.
  • Podrías tener problemas de duplicado de contenido.

Abajo explicare con mayor detalle cada uno.

¿Como afecta mi autoridad de enlace?

En nuestra mente sabemos, como dueños del sitio y según el caso descrito arriba, que la pagina principal es “http://www.tu-sitio.com” pero para nuestros visitantes y los motores de búsqueda, esto no es así. Muchos de nuestros visitantes podrían creer que “http://www.tu-sitio.com.gt” o http://tu-sitio.com“ es la verdadera página de inicio de nuestro sitio. Cualquiera podría hacer un enlace a cualquiera de los cuatro URL’s.

Esto en pocas palabras significa, que nuestra autoridad de enlace ha sido diluida dentro de cuatro URL’s. La fluidez de autoridad de enlace no ha sido dirigida a “http://www.tu-sitio.com” únicamente, sino a sido dividida, en este caso entre cuatro URL’s.

¿Porque podría tener problemas de duplicado de contenido, si tengo problemas de Canonicalización?

Para muchos buscadores, en especial Google, el duplicado de contenido es una falta grave. ¿Porque? Muchos buscadores podrían penalizar tu sitio por la simple razón que ellos buscan que tu sitio web contenga contenido único y que sea útil y relevante para el visitante que realizo la búsqueda en el buscador. Esto lo explica más detalladamente la Guia para Webmasters de Google. O sea que si tenemos cuatro URL’s con el mismo contenido, los buscadores entenderan que hay cuatro sitios diferentes con el mismo contenido.

¿Como los buscadores podrían penalizar mi sitio web?

Pues muy sencillo, le dan menos relevancia a tu sitio web en sus páginas de resultados, en el peor de los casos no indexarían ninguno de nuestros cuatro URL’s por tener el mismo contenido.

¿Como puedo solucionar estos problemas de Canónicalización en mi sitio?

Existen dos formas de corregir estos problemas:

Primer Método

Reciente mente Google, Yahoo y Microsoft nos dieron a conocer un nuevo “tag canónico” el cual puede ser especificado dentro el Header en el HTML en el URL en cuestión, el que debe de ser tratado como una copia y menciona el URL canónico a donde toda la autoridad de enlace y métricas de contenido deberían de fluir.

Por ejemplo:

Dentro de “http://www.tu-sitio.com/index.html” deberíamos de agregar el parámetro:

<link rel=”canonical” href=”http://www.tu-sitio.com/” />

Esto le explicaría a los motores de búsqueda que todo la autoridad de enlace de /index.html recaerá sobre el URL canónico en este caso http://www.tu-sitio.com/. Es importante mencionar que existen varios problemas y limitaciones al utilizar este tipo de tags. Entre estos puedo mencionar:

  • Los visitantes seguirán utilizando los diferentes URL’s ya que solo los buscadores podrán identificar cual es el URL canónico.
  • No puede ser utilizado para dominios específicos de país como “tu-sitio.com.gt” o “tu-sitio.com.mx”.

Segundo Método

El segundo método para estos solucionar estos problemas es por medio de los redireccionamientos 301. Un redireccionamiento 301 es un redireccionamiento permanente de un URL a otro, no importando si es otro dominio. Esto facilita a los motores de búsqueda y los visitantes identificar el URL canónico. El eterno problema de los redireccionamientos 301 es que muchas veces si no eres programador o no tienes mucha experiencia como desarrollador podría ser un poco complicado implementarlo. De igual manera te daré un ejemplo de cómo hacer un redireccionamiento 301 simple para Apache.

Primero debes tener acceso al .htaccess dentro de tu servidor. Recuerda de punto adelante de htaccess significa que es un archivo oculto, cambia la configuración de tu programa de FTP para poder verlo. Dentro del archivo escribe los siguientes parámetros, para redireccionar de un URL sin www a un URL con www, Ej. http://tu-sitio.com a http://www.tu-sitio.com:

RewriteEngine On

RewriteCond %{HTTP_HOST} ^tu-sitio.com [NC]

RewriteRule ^(.*)$ http://www.tu-sitio.com/$1 [L,R=301]

Espero que este pequeño post ayude a identificar y solucionar algunos de tus problemas de Canonicalización dentro de tu sitio web. Escríbeme si tienes dudas o comentarios.

Bruno Mertins