J'ai mis en place un pot de miel destiné à engluer les robots qui ne respectent pas le protocole standard d'exclusion (en anglais, désolée, je n'en connais pas en français), et plus particulièrement les robots aspirateurs d'adresses électroniques (email). Bien que je n'aie pas repris les outils proposés par l'auteur, je me suis fortement inspirée d'une page très détaillée (mais en anglais aussi) qui explique comment réaliser un piège efficace.
Vous connaissez le principe des attrape-mouches? Un ruban collant émet un odeur pour attirer les mouches, et les empêche de s'envoler une fois qu'elles se sont posées dessus. C'est à peu près la même idée ici, mais adapté à l'informatique et aux robots...
Le script utilisé est écrit en PHP. Bien qu'assez simple, il met en œuvre plusieurs ruses...
Bien entendu, les robots respectant les standards sont écartés du
piège grâce au fichier robots.txt
.
Mon piège est placé sous la Licence Publique Générale GNU (GNU Public License). Vous pouvez le télécharger et l'utiliser vous aussi; je vous engage vivement à le modifier et à l'améliorer, afin que les robots parasites soient toujours soumis à des conditions plus difficiles!
Les instructions d'installation sont assez simples. Tout d'abord,
votre serveur doit être capable d'exécuter du PHP, sinon le script
ne risque pas de fonctionner. Installez le piège dans un
répertoiren, disons /piege/glue/
(arborescence relative
à votre serveur), et ajoutez les lignes suivantes dans votre fichier
robots.txt
, pour protéger les bons robots:
User-agent: *
Disallow /piege/glue/
Pour activer la récursivité, vous devez ensuite dire au serveur de
renvoyer toutes les pages sur le script index.php
. Par
exemple, avec Apache et mod_rewrite
:
RewriteEngine On
RewriteRule /piege/glue /piege/glue/index.php
Attention! Ne suivez pas les liens du paragraphe suivant. Le contenu de la page cible est volontairment très long à charger, et il contient, de manière aléatoire, des caractères binaires susceptibles de faire planter votre navigateur, voire votre système. Si vous décidez néanmoins de charger cette page, faites-le à vos risques et périls.
Contrairement à ce que prétend ce paragraphe, la page suivante n'est pas réellement un livre d'or (guestbook) plein d'adresses email à aspirer pour nos ennemis les spammeurs, et plein de signatures.
Ce site est membre de Chocolat: miam!.
Retour à ma page sur l'informatique.
Retour à ma page principale.
Dernière modification: 30 août 2003.