Cuando hablamos de contenido duplicado nos referimos a situaciones en las que tienes una pieza de contenido única en tu sitio, pero con múltiples URLs. Todas estas URLs conducen a esa misma pieza de contenido.
Esto puede ocurrir por una multitud de razones que vamos a repasar. También discutiremos las mejores maneras de solucionar este problema.
A tener en cuenta: esto es diferente al problema en el que otros sitios duplican tu contenido en sus propios sitios. A esto lo llamaríamos contenido duplicado externo. Esto es más difícil de controlar; sin embargo, podemos ayudar con el contenido duplicado interno.
Google prioriza proporcionar una gran experiencia de usuario para sus usuarios. Cuando encuentra contenido que es significativamente similar, debe decidir qué fuente o URL obtiene la clasificación más alta.
Si piensa que un sitio web está intentando manipular las clasificaciones para obtener más tráfico, el sitio o la URL pueden ser degradados. En circunstancias extremas, puede ser eliminado del índice de Google por completo. Por esta razón, es un problema importante a resolver.
Hay una variedad de herramientas en línea que pueden verificar el contenido duplicado.
Aquí en Labrika, ofrecemos un verificador de contenido no original, que verificará y mostrará cualquier URL en internet que muestre contenido similar (o el mismo). Esto funcionará incluso si está dentro de tu propio sitio. Haciéndolo una manera rápida y fácil de encontrar contenido duplicado dentro de tu propio sitio web.
Para contenido duplicado externo, un sitio como Copyscape es excelente. Alternativamente, Siteliner (otra herramienta creada por Copyscape) es útil para encontrar contenido duplicado interno. Ofrecen un servicio gratuito limitado, o un servicio premium de pago.
Nota: servicios como estos pueden notar un nivel más alto de contenido duplicado que Google, ya que tienden a incluir todos los elementos en la página, como las barras laterales. Como Google no incluiría esto en su análisis, estas herramientas pueden dar un conteo inflado de contenido duplicado.
Si ya tienes una cuenta de Labrika, puedes usar nuestro verificador de contenido no original, o si no, puedes registrarte aquí.
Otro método, si tienes más tiempo, es usar Google mismo. Hay muchos operadores de búsqueda de Google, pero deberías comenzar con los operadores site: e intitle:.
Por ejemplo, digamos que tienes un artículo o página llamada: "Cómo volar una cometa muy alto".
Para encontrar todas las URLs que apuntan a esto, ingresa en la búsqueda de Google:
site: mysite.com intitle:"Cómo volar una cometa muy alto"
Google entonces buscará todas las instancias de este nombre de página dentro de tu sitio. Idealmente, debería devolver solo una, si devuelve más, sabes que tienes contenido duplicado.
Por supuesto, este es un proceso más largo, pero puede ser útil si solo tienes un sitio muy pequeño.
1.- HTTP/HTTPS y WWW/ no-WWW
El contenido tiene enlaces que contienen: http://mysite.com/article1 y también https://mysite.com/article1
Tu sistema se refiere a tu sitio como: www.mysite.com o mysite.com
Y hay enlaces al mismo contenido usando ambas versiones? Si es así, estás creando contenido duplicado.
2.- Comentarios paginados
Sistemas como WordPress ofrecen la opción de paginar comentarios. Esto evita mostrar páginas muy grandes con posiblemente cientos de comentarios en la parte inferior de cada artículo. Cada página tiene su propia URL, como:
mysite.com/myarticle/comments-page-1 y mysite.com/myarticle/comments-page-2
Estos son ejemplos de múltiples URLs para la misma pieza de contenido. Por lo tanto, creando un escenario de contenido duplicado.
3.- IDs de sesión
Los IDs de sesión son muy útiles para permitir que un sitio web recuerde a un visitante y las acciones dinámicas que realizó en tu sitio. Por ejemplo, puede referirse a un carrito de compras que contiene todos los productos que el usuario quiere comprar. A medida que el usuario navega por el sitio, ese ID de sesión único se adjunta a la URL de cada página visitada. Lo que significa que se crea una URL completamente nueva para cada página. Una vez más creando contenido duplicado.
En este caso, las Cookies proporcionan un mejor enfoque ya que los motores de búsqueda nunca las ven. Pero entraremos en las soluciones más adelante.
4.- Páginas amigables para imprimir
Algunos sistemas ofrecen páginas amigables para imprimir como una opción. Cualquier enlace en el sitio web a una versión para imprimir es recogido por los motores de búsqueda. Esto hace que detecten contenido duplicado.
Si deseas esta función, es mejor usar CSS o Javascript para generar la página imprimible. O excluirlas de las búsquedas usando una etiqueta nofollow o noindex. O excluirlas en robots.txt.
5.- Desarrolladores web que no 'lo entienden'
Un desarrollador verá una pieza de contenido como un registro en una base de datos, con un número de referencia único. Pero esto no es cómo un motor de búsqueda ve este contenido. El software del sitio web puede generar múltiples URLs que enlazan al mismo contenido de diferentes maneras. Los motores de búsqueda detectan que hay múltiples URLs únicas que recuperan el mismo contenido. Por lo tanto, indicando que puede ser contenido duplicado.
En este caso, necesitarías informar a tus desarrolladores para asegurarse de que para cada URL única no haya contenido duplicado, sin excepciones.
6.- Parámetros de URL
Cuando un sistema usa parámetros en la URL para identificar una pieza de contenido en la base de datos, esos parámetros pueden a menudo ser construidos de diferentes maneras, para el mismo contenido.
Por ejemplo:
“/?id=1&cat=2” podría referirse a un artículo único, pero también lo hace:
/?cat=2&id=1 (cat = Categoría, ID = referencia única de la base de datos).
Un motor de búsqueda ve dos enlaces diferentes al mismo contenido. Para este problema, Google tiene una herramienta especial de Manejo de Parámetros donde puedes indicar cómo manejar parámetros como estos.
Una redirección 301 puede ser servida, por tu servidor web, al navegador de un usuario, o a un rastreador de motores de búsqueda, cuando se busca una URL específica. Le dice al usuario o al motor de búsqueda que la dirección del enlace está desactualizada e indica la nueva dirección. ¡Es el equivalente en codificación de redirigir el correo cuando nos mudamos de casa!
Una redirección 301 se usa más comúnmente cuando te mudas de un sitio web a otro (por ejemplo, un cambio de nombre). Pero, también puede usarse para redirigir múltiples URLs a una 'URL maestra'. Esto ayuda a los motores de búsqueda a mantener sus índices actualizados. Y te ayuda a evitar cualquier problema de contenido duplicado.
Algunos sistemas web te permiten configurar redirecciones en la configuración de administración. Los sistemas Linux más antiguos requieren que las insertes manualmente en el archivo .htaccess. Este es un enfoque más técnico y práctico, pero no es demasiado difícil de hacer.
Una entrada típica de redirección podría verse algo así:
Redirect 301 /old-page.html /new-page.html
La palabra canónica significa 'la URL autorizada' en este contexto. Nominas una URL como la versión 'canónica' para los motores de búsqueda.
Es una solución técnica simple en teoría, pero implementarla puede ser un poco complejo. Sin embargo, resuelve el problema de múltiples URLs que apuntan al mismo contenido. También mejora el SEO de tu sitio y tiene el mismo efecto que las redirecciones 301 sin redirigir nada. Piénsalo como una ‘redirección 301 suave’.
Ejemplo de una etiqueta canónica:
<link rel="canonical" href="https://mysite.com/my-article/" />
El atributo rel en HTML especifica la relación con el documento vinculado y debe ir acompañado del atributo href.
La mayoría de los sitios tienen un pie de página que se repite en la parte inferior de cada página. No es una buena idea colocar mucho contenido aquí. En su lugar, enlaza a una página que resuma todas las cosas que quieres que los usuarios sepan. Esto evita que el texto se repita en múltiples páginas, innecesariamente.
A veces puedes tener contenido muy similar en varias páginas. Por ejemplo, varios productos similares en una gama. Donde sea posible, siempre es mejor consolidar tanto como puedas en una sola página. O enfocarte en cambiar el texto de cada producto, para que sea lo suficientemente diferente del resto, mientras sigues transmitiendo el significado.
Esto puede ser mucho esfuerzo, pero vale la pena al final para evitar problemas de contenido duplicado.