Esta es una publicación invitada de Lior Levin.
El principal luchador contra el spam de Google, Matt Cutts, recientemente publicó una larga entrada de blog sobre el estado de la batalla de Google con los spammers.
En la publicación, Cutts dijo que, si bien el spam en el índice de Google era menos de la mitad de lo que era hace cinco años, ese spam ha aumentado en el índice de Google en los últimos meses y, para ciertas consultas, se ha vuelto más notorio.
Según Cutts, este cambio no se debe solo al hecho de que hay más spammers que nunca tratando de hacer trampa para llegar a una clasificación más alta en los motores de búsqueda, sino porque la reciente actualización de Caffeine de Google tiene al motor de búsqueda indexando más contenido que nunca. incluido el correo no deseado.
Sin embargo, describió el plan de Google para luchar contra este repunte y evitar que se convierta en un problema más grave. Específicamente, describió tres cambios en Google que espera mejoren la calidad de los resultados de Google y mejoren la experiencia de búsqueda para todos.
El primer cambio, que Google lanzó recientemente, está dirigido a los spammers y es un «clasificador de nivel de documento rediseñado» que hace un mejor trabajo al detectar contenido de spam en una sola página. Esto incluye cosas como palabras repetidas en el texto, así como ciertos tipos de comentarios no deseados.
La segunda mejora, que actualmente se está evaluando, es un cambio algorítmico dirigido a sitios que copian contenido de otras páginas, generalmente sin permiso. Estos sitios a menudo copian grandes bloques de contenido con muy poco material original, pero a veces se clasifican muy bien, incluso por delante de los sitios que produjeron el contenido originalmente.
Sin embargo, es el tercer y último cambio el que ha generado más discusión. Según Cutts, Google está explorando formas de reducir aún más la clasificación de las llamadas «granjas de contenido» o sitios que producen grandes cantidades de contenido a bajo costo, generalmente a través de mano de obra contratada que a menudo es de calidad cuestionable. Esto incluye empresas como Demand Media, que opera eHow, Livestrong y otros sitios.
Según Cutts, Google realizó dos cambios en 2010 para reducir el impacto de estas granjas de contenido, pero entiende que la gente pide que se tomen medidas aún más enérgicas. Los sitios, sin embargo, han sido controvertidos porque, aunque a menudo tienen contenido de menor calidad, no se consideran spam web tradicional.
Dado que Demand Media acaba de tener una oferta pública inicial que lo valoró en $ 1.5 mil millones, es fácil ver cuánto valor ha podido crecer la empresa a través de su contenido «farming». Lo que queda por ver es si Google será capaz de sofocar su prevalencia en los resultados, especialmente para búsquedas de cola larga a las que se dirige.
Sin embargo, lo que está claro es que, incluso después de una década en la industria, Google todavía está luchando con problemas de calidad de contenido en su índice y está luchando para mantener a raya a los spammers, raspadores y granjeros de contenido.
Aunque definitivamente ha progresado en la última década, claramente todavía queda mucho trabajo por hacer y Google se está preparando para hacerlo.
Todo lo que podemos hacer es sentarnos, observar lo que sucede y esperar que los sitios legítimos y de alta calidad no se vean atrapados inadvertidamente en la mezcla.
Danos tu opinión