sábado, abril 15, 2006

Blogger utiliza un clasificador automático de spam

Uno de los problemas más serios para los gestores de los servicios de creación de blogs es el del spam. Algunos de ellos (como Blogger) son gratuitos, y son aprovechados por los spammers para crear 'blogs-farsa' o 'splogs', que sirven para conseguir ingresos vía AdSense o para enlazar desde ellos a otras páginas web que quieren posicionar en buscadores.

Desde hace unos meses, Blogger está luchando contra los 'splogs', y ahora, en este post de su blog oficial, nos asegura que están utilizando en esta batalla una herramienta que clasifica automáticamente el spam.

Aunque reconocen que, al ser automático, el sistema detecta casos de spam cuando realmente no los hay, destaca que el porcentaje es minúsculo. Aún así, ha implamentando algunas soluciones para que solventar estos errores, como alertas en el panel de control de Blogger para avisar a su responsable.

Este 'clasificador automático de spam' utilizará probablemente un detector de patrones que siguen frecuentemente los sitios web de este tipo. Sobre este tema, existe un muy interesante post de Abel González, en el que traduce al español y comenta otro en inglés de William Slawski, el cual detalla una patente de Microsoft destinada a combatir los casos más básicos de páginas web creadas para realizar spam en buscadores.