Qué es el webspam, cómo denunciarlo, cuál es su relación con la IA… y cómo actúa Google frente a él

Tú también puedes colaborar a que la red sea un sitio mejor: descubre qué es el webspam y cómo denunciar a las páginas que lo utilizan.
Qué es el webspam, cómo denunciarlo... y cómo actúa Google frente a él
12 de abril, de 2023
Copiar enlace

A lo largo de su historia, Google ha tenido que ganar muchas batallas para tratar de controlar las malas prácticas que muchos webmasters realizan con el fin de tratar de engañar a su algoritmo y mejorar su posicionamiento de forma ilícita. Poco a poco el gigante de internet va ganando terreno en su lucha contra el webspam y en su intensa búsqueda por informar a los internautas sobre estas prácticas y cómo denunciarlas.

Qué es el webspam o spam web

Ojo: al referirnos a webspam no estamos hablando de esos mensajes de correos molestos que clasificamos como spam en nuestras bandejas de entrada. El concepto webspam es el término utilizado para definir a las malas prácticas de webs que intentan engañar a Google para mejorar su posicionamiento o, directamente, llevan a cabo actividades ilícitas para ello.

Entre los elementos considerados parte del webspam están:

  • La utilización de redireccionamientos engañosos a otras webs
  • Páginas sin contenido o con contenido sin sentido
  • Texto oculto o invisible
  • Páginas que imitan a otras webs o que suplantan la identidad de una persona
  • Páginas con opiniones falsas
  • Directamente, webs pensadas para recoger los datos del usuario y utilizarlo para fines ilícitos

La lucha de Google contra el webspam: sus algoritmos automatizados

Si bien Google refina constantemente su algoritmo para enfrentar el webspam, también ha puesto a disposición de los usuarios un sitio web por medio del cual es posible generar un reporte de forma manual.

Tal y como Gary Illyes, webmaster en Google, aseguró hace unos años en el blog oficial de la compañía, la mayoría de estas denuncias no acaban en una acción manual (procedimiento por el que un revisor humano determine si el sitio web es spam o no y de serlo lo penalice de inmediato). Sin embargo, están destinadas a ayudar a comprender a su algoritmo el lugar donde puede haber fallos de cobertura en sus sistemas automatizados en la detección de spam. Google utilizará esta información con el fin de actualizar estos algoritmos, así que no verás caer un sitio web simplemente por el informe.

Según su último informe, referido al año 2022, Google se muestra muy satisfecha con los resultados de su lucha contra el spam web. Este gran avance ha sido gracias a la ayuda de su inteligencia artificial, SpamBrain. SpamBrain se lanzó en 2018 y desde entonces Google no ha cesado de mejorar continuamente su rendimiento. Ya en 2021, SpamBrain había identificado casi seis veces más sitios de spam que en 2020: 40.000 millones de estos sitios web cada día . Ahora, este dato ha vuelto ha aumentar notablemente. Tal y como explica Google, en 2022 “SpamBrain detectó 5 veces más sitios de spam en comparación con 2021 y 200 veces en comparación con cuando se lanzó por primera vez. Gracias a SpamBrain, pudimos asegurarnos de que más del 99 % de las visitas de la búsqueda estén libres de spam”.

SpamBrain también fue un factor importante para detectar más rápidamente el spam en el momento del rastreo. Así, el buscador puede identificar mejor el spam cuando visita una página por primera vez y no indexarlo en absoluto, evitando que los usuarios de Google puedan llegar a él.

Cómo ayudar a Google a detectar el spam

De acuerdo con las directrices de Google en relación con la denuncia manual de webspam: “Si crees que otro sitio está abusando de las pautas de calidad de Google, puedes denunciarlo presentando un informe de spam. Google prefiere desarrollar soluciones escalables y automatizadas a los problemas, y utilizará el informe para mejorar aún más nuestros sistemas de detección de spam”.

Puedes realizar un informe manual de un sitio que probablemente realiza webspam en la página web de Google específica para estas denuncias. Una vez que has realizado el informe, los empleados de Google pueden asignar alguna sanción a sitios o páginas individuales, sin embargo, los informes de spam no conducirán en todos los casos a estas acciones manual directamente en el sitio web. Por otro lado, si tú recibes una acción manual, se te anunciará directamente con un mensaje en Google Search Console.

Qué tipo de contenido se considera webspam

Google detalla muchos tipos de malas prácticas en este sentido. Estas son algunas de las más comunes:

Cloaking

El encubrimiento o cloaking se refiere a la práctica de presentar contenido diferente a los usuarios y motores de búsqueda con la intención de manipular las clasificaciones de búsqueda y engañar a los usuarios. Los ejemplos dados por Google incluyen:

  • Mostrar una página sobre destinos de viaje a los motores de búsqueda mientras se muestra una página sobre medicamentos con descuento a los usuarios
  • Insertar texto o palabras clave en una página solo cuando quien visita la página es un motor de búsqueda, no un visitante humano

Contenido fraudulento

Tal y como explica Google, “El contenido fraudulento intenta mejorar su posición en los resultados de búsqueda de Google valiéndose de diferentes estratagemas; por ejemplo, puede incluir texto oculto, redirecciones engañosas, o usar técnicas de encubrimiento. El objetivo de estas prácticas es afectar a la calidad de nuestros resultados y empeorar la experiencia de búsqueda de todos los usuarios”.

Contenidos/enlaces ocultos

Texto o enlaces ocultos es el acto de colocar contenido en una página de una manera únicamente para manipular los motores de búsqueda y no para que los visitantes humanos puedan verlo fácilmente. Ejemplos de texto oculto o enlaces que violan nuestras políticas:

  • Usando texto blanco sobre un fondo blanco
  • Ocultar texto detrás de una imagen
  • Usar CSS para colocar el texto fuera de la pantalla
  • Ocultar un enlace vinculando solo un carácter pequeño (por ejemplo, un guion en medio de un párrafo)

Contenido spam generado de forma automática – Inteligencia artificial

Google no ha evitado referirse al gran tema candente de los últimos meses: las inteligencias artificiales. Así, el gigante online explica que “la IA y la automatización pueden ser una herramienta útil para crear contenido útil, pero si la IA se usa con el propósito principal de manipular las clasificaciones de búsqueda, eso es una violación de nuestra política contra el spam generado automáticamente”.

Recordemos que a principios de año, Google publicó una guía sobre el tema, en la que explicaba su postura acerca de los contenidos generados a través de IA como ChatGPT. En ella, aclaraba que “No todo uso de la automatización, incluida la generación de IA, es spam. La automatización se ha utilizado durante mucho tiempo para generar contenido útil, como resultados deportivos, previsiones meteorológicas y transcripciones. La IA tiene la capacidad de impulsar nuevos niveles de expresión y creatividad, y de servir como una herramienta fundamental para ayudar a las personas a crear contenido excelente para la web. (…)  El uso adecuado de la IA o la automatización no va en contra de nuestras pautas. Esto significa que no se utiliza para generar contenido pensado principalmente para manipular las clasificaciones de búsqueda, lo que va en contra de nuestras políticas de spam”

Para Google, “el contenido spam generado automáticamente es contenido que se ha generado mediante programación sin producir nada original ni agregar suficiente valor; en cambio, se generó con el propósito principal de manipular las clasificaciones de búsqueda y no ayudar a los usuarios”. Esto incluye:

  • Texto que no tiene sentido para el lector pero que contiene palabras clave de búsqueda
  • Texto traducido por una herramienta automatizada sin revisión humana antes de publicar
  • Texto generado a través de procesos automatizados sin tener en cuenta la calidad o la experiencia del usuario

Keyword stuffing (acumulación de palabras clave)

Se refiere a la práctica de llenar una página web con palabras clave o números en un intento de manipular las clasificaciones en los resultados de búsqueda de Google. A menudo, estas palabras clave aparecen en una lista o grupo, de forma poco natural o fuera de contexto. Entre los ejemplos citados por Google se encuentran:

  • Listas de números de teléfono sin valor añadido sustancial
  • Bloques de texto que enumeran ciudades y regiones para las que una página web está tratando de clasificar

Link spam

Como ya sabes, Google utiliza los enlaces como un factor importante para determinar la relevancia de las webs. Para sus políticas, “cualquier enlace que esté destinado a manipular las clasificaciones en los resultados de la Búsqueda de Google puede considerarse spam de enlace. Esto incluye cualquier comportamiento que manipule los enlaces a tu sitio o los enlaces salientes”. En este punto se incluye la compra-venta de links con fines de posicionamiento, un exceso de intercambio de links con otras webs o el uso de programas automatizados para crear links hacia tu web.

Spam de enlaces de pago

Para Google “La participación en esquemas de enlaces supone una infracción de las directrices para webmasters de Google y puede afectar al posicionamiento de un sitio dentro de los resultados de búsqueda”.

Software malicioso

El contenido pirateado es cualquier contenido colocado en un sitio sin permiso, debido a vulnerabilidades en la seguridad de un sitio. “El contenido pirateado brinda resultados de búsqueda deficientes a los usuarios y potencialmente puede instalar contenido malicioso en sus máquinas”, explica Google. Si crees que un sitio está infectado por software malicioso o distribuye software malicioso o no deseado, puedes avisar a Google desde este formulario.

Si crees que has encontrado una página diseñada para parecerse a otra y así robar información personal de los usuarios, Google cuenta con un formulario específico para denunciarlo.

Por supuesto que le tomará algo de tiempo a Google recopilar la información de estos informes de spam para mejorar su algoritmo y que muestre un impacto en los resultados de búsqueda, premiando a las webs que siguen las directrices que Google ha marcado.

Imagen: Depositphotos

Otros artículos de

Publicado por

LATAM Content Coordinator
Coordinadora de Contenido Latam para Marketing4ecommerce, ayudando a colaborar en este portal desde el 2016 y escribiendo sobre eCommerce, marketing y temas de tecnología desde el 97.

Suscríbete a M4C

Únete a nuestro canal de Telegram

¡Todo lo que necesitas saber!

Apúntate a nuestra newsletter y recibe gratis en tu correo nuestros mejores artículos sobre eCommerce y marketing digital.