SEO: Cómo lidiar con el contenido duplicado

SEO: Cómo lidiar con el contenido duplicado

¿Por qué el contenido duplicado es un problema y cómo puede resolverlo? En el siguiente artículo, responderemos a estas preguntas.

Contenido duplicado: el problema

Ahora podría decir que no tenía contenido duplicado. Pero lo más probable es que la razón de esto sea que no sabes completamente qué es el contenido duplicado. ¿Te aseguraste de que los contenidos de tu sitio web no aparezcan en varios lugares a la vez? Suena bien. ¿Se asegura de que su contenido no sea utilizado por terceros, lo que le permite asegurarse de que su contenido solo esté disponible en su sitio? Suena bien también. Desafortunadamente, esto solo cubre los problemas secundarios. La mayoría de los casos de contenido duplicado tienen orígenes tecnológicos. Centrémonos en el problema de que se crea contenido duplicado cuando otros operadores de páginas usan su contenido, por ejemplo, para asociaciones de contenido. Las consecuencias negativas de este contenido duplicado ya se pueden evitar colocando un enlace en el contenido respectivo que lo lleve de regreso a su original. Convenientemente, agregue algo como «El artículo original fue publicado en YourWebsite», y el motor de búsqueda tiene suficientes pistas para encontrar el origen del contenido.

El motor de búsqueda y usted: compartir un interés

Al final, el contenido duplicado no solo es un problema para ti, sino también para el buscador. El valor de un motor de búsqueda se define por su resultado. El usuario quiere encontrar contenido relevante en su palabra clave de búsqueda. El motor de búsqueda se confunde con el contenido duplicado y no es realmente capaz de decir cuál de los cinco textos idénticos es el original. Sin embargo, también depende del motor de búsqueda, lo que permite que los usuarios lo encuentren, por lo que Google y compañía pueden convertir fácilmente su problema en el suyo. De hecho, es su problema cuando Google guía a su visitante a la quinta copia de su original, en lugar de llevarlo a usted, el creador del contenido. Digamos que hay una congruencia de intereses. Los motores de búsqueda quieren encontrar originales relevantes y usted quiere que los motores de búsqueda muestren sus originales relevantes.

Las consecuencias del contenido duplicado: hasta que alguien llore

Respecto a las consecuencias del contenido duplicado, las opiniones difieren, aunque Google adopta una postura bastante clara. No hay sanciones por contenido duplicado. Las consecuencias negativas, con una mala clasificación por encima de todo, básicamente surgen por sí solas. Si el contenido original no se puede identificar sin dudas, corres el riesgo de tener que compartir la atención con tus copias. Según su algoritmo, Google elegirá una versión que superará a todas las demás, aunque no sea la original.

Contenido duplicado intencional en páginas propias o externas

Primero, ocupémonos del caso en el que intencionalmente tengas el mismo contenido en tu página en varios lugares. Ahora, los motores de búsqueda indexan todas las versiones, creando de inmediato el problema de la selección de relevancia. Sin embargo, la opción de distribuir enlaces externos a todas las versiones es aún peor, ya que esto debilita el contenido individual en aspectos de SEO. Sería mucho más efectivo tener una ubicación de enlace agrupada para un contenido. Aquí es donde se utiliza el concepto de «URL canónica». Esta URL canónica es el contenido que defines como original. Ahora, ingrese esta URL original como la URL canónica en el encabezado de las páginas que contienen copias. Esto funciona de la siguiente manera:

<link rel="canonical" href="http://www.example.com/product.php?item=swedish-fish" />

(El ejemplo es del blog de Google Webmaster Central) El motor de búsqueda reconoce esta sugerencia como una especie de redireccionamiento al contenido original. Esta forma de redirección es una variante suave de la 301 colocada a través de Htaccess como redirección permanente, lo que no nos ayudaría en esta situación. Hasta aquí el contenido duplicado interno. Si no tiene acceso al encabezado de la página donde se muestra el contenido, puede volver al consejo mencionado anteriormente y agregar manualmente el enlace a la URL original al final o al principio del contenido duplicado. Siempre colocaría el enlace con una descripción, incluso si tiene acceso al encabezado de la página porque el usuario realmente no tendrá acceso al enlace canónico en el encabezado.

Contenido duplicado no deseado en sitios externos

Por supuesto, las opciones de usar un 301, un enlace canónico o incluso un enlace normal en el texto no funcionan para el uso no autorizado de su contenido en algún lugar de Internet. A lo sumo, esto último podría funcionar asegurándose de que su fuente RSS contenga el vínculo de retroceso al original en su página al final de cada artículo. Los llamados sitios scraper que generan su contenido barriendo las fuentes RSS de extraños pueden tomar su contenido de la forma en que está en su fuente RSS, dejando la posibilidad de que permanezca su vínculo de retroceso. El raspador profesional elimina automáticamente estos enlaces, pero vale la pena intentarlo, ya que el esfuerzo adicional solo aparece una vez durante la configuración del feed. El primer problema es encontrar el contenido duplicado externo en primer lugar. Aquí, motores de búsqueda especiales como copyscape ven a jugar. Allí, todo lo que necesita hacer es ingresar su URL. Luego, el servicio busca en la web contenido que sea idéntico a su sitio web. Así es como se ve el resultado de la búsqueda de Dr. Web, por ejemplo:

Si ya tiene sospechas específicas, una simple búsqueda en Google es suficiente. Copie una o dos oraciones del contenido, ponga entre corchetes el texto e ingréselo en la barra de búsqueda de Google. Como resultado, encontrará todas las páginas donde se usó esta redacción exacta. Por supuesto, también puede buscar títulos u otros componentes de contenido usando el mismo método, e incluso usar la búsqueda de imágenes para buscar imágenes específicas. Ahora puede ponerse en contacto con el operador de la página y exigirle que elimine el contenido. También puedes recurrir a Google Por aquí por diferentes asuntos legales. Google proporciona esta forma para informes sobre infracción de derechos de autor (DMCA).

Contenido duplicado no deseado en sus propias páginas

El contenido duplicado en sus propias páginas es un problema mucho mayor. Puede que no lo creas, pero es así. Por supuesto, esa no es tu intención, y no apoyas esto intencionalmente. El motivo del contenido duplicado en su sitio web es casi 100 por ciento seguro de ser tecnológico. Los sistemas de administración de contenido modernos ofrecen la flexibilidad de hacer que su contenido sea accesible bajo una gran cantidad de URL diferentes. Usemos WordPress como ejemplo. Aquí, puede acceder al mismo artículo a través de la URL de la publicación, una URL que incluye al autor, así como una URL que contiene el contenido. Además, podría usar una URL con diferentes parámetros, para paginación, clasificación o seguimiento, lo que también conduce al mismo contenido. De esta manera, habrías creado un gran contenido duplicado sin darte cuenta. Otra fuente popular de contenido duplicado son los sitios web fáciles de imprimir que todavía se usan con mucha frecuencia en lugar de una hoja de estilo impresa. En muchos casos, estas páginas ajustadas parecen ser especialmente relevantes, ya que solo brindan contenido puro, sin un entorno disruptivo. Esa no es la intención… Las páginas a las que se puede acceder con y sin www, así como a través de HTTPS o HTTP simple, o con o sin una barra inclinada final son igual de problemáticas. Todos ellos crean contenido duplicado. Las Herramientas para webmasters de Google ofrecen una introducción a la búsqueda de contenido duplicado en su propio sitio web. Aquí, abra «Mostrar en búsqueda» y luego «Mejoras de HTML». Si hay páginas con duplicados en el título o la descripción, las encontrará aquí. Un resultado en esta lista hablaría de la existencia de contenido duplicado que se podría encontrar fácilmente. La herramienta Delineador de sitios funciona como Copyscape, pero para tus propios contenidos. Aquí, recibe evaluaciones meticulosamente investigadas que parecen más dramáticas de lo que realmente son a primera vista. La razón de esto es que cada duplicado se encontrará y se hará visible. Sin embargo, la mayoría de los duplicados mostrados serán intencionales, como los cuadros de autor debajo de los artículos.

Evitación estructural de contenido duplicado

La mayoría de los duplicados se pueden solucionar utilizando medios simples, ya que no son dobletes en el sentido literal. De hecho, son contenidos accesibles de múltiples maneras. Por lo tanto, la palabra clave aquí es: higiene de URL. Primero, asegurémonos de que, al usar HTTPS, siempre se use el protocolo respectivo y que no haya más entregas a través de HTTP. Usando Mod_rewrite y htacces, esto se hace así:

RewriteEngine On
RewriteCond %{HTTPS} !=on
RewriteRule ^/?(.*) https://www.drweb.de/€1 [R=301,L]

Para asegurar que el www siempre se agrega a la URL, evitando duplicados debido a una especificación de protocolo faltante, escriba:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^drweb.de€
RewriteRule (.*) http://www.drweb.de€1 [R=301]

Ahora, ocupémonos de la barra inclinada final al final de las URL. Este es un problema que muchos de ustedes no tendrán, pero es fácil de prevenir. Entonces por qué no hacerlo? Este htaccess hace que cada URL reciba la barra inclinada final:

RewriteEngine On
%{REQUEST_FILENAME} !-f
RewriteRule ^([^/]+)/?€ https://www.drweb.de/€1/ [R=301,L]

Eres libre de ir en sentido inverso, para evitar siempre la barra oblicua. Lo mismo se aplica a obligar a la www. Es importante mantener la coherencia en todo el sitio web. En la mayoría de los casos, las URL superfluas que los diferentes sistemas de administración de contenido proporcionan como formas adicionales para el contenido pueden simplemente desactivarse en la configuración del CMS respectivo. Esa es la mejor manera de evitar estos posibles duplicados. Si eso no funciona, existe la opción de último recurso de usar noindex en las etiquetas meta de la página respectiva o la exclusión completa de áreas de estructura única del índice de Google a través del robots.txt. Sin embargo, Google no recomienda esta forma de bloquear completamente el contenido. Si el sistema no puede desactivar las variantes de URL innecesarias, debe usar la etiqueta canónica para apuntar a la URL en la que desea mostrar la URL original del contenido.

Conclusión: Prácticamente todos los operadores de sitios web tienen problemas con el contenido duplicado

Por lo general, la pregunta no será si tiene un problema con el contenido duplicado, sino hasta qué punto. Afortunadamente, todas las formas presentadas para evitar duplicados en sus propias páginas se pueden poner en práctica con bastante facilidad. Solo necesitas invertir el esfuerzo.

Otras lecturas:

#SEO #Cómo #lidiar #con #contenido #duplicado

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada.