Spam & botnets : le poids des mots…

L’idée de mes amis de MessageLabs est simple mais efficace : prendre un large échantillon aléatoire de spams sur une période d’une semaine, en extraire les mots significatifs puis dégager les tendances façon “nuage de mots-clefs” (la taille est proportionnelle à la fréquence), et voilà le résultat :

Folkspam

Rien de surprenant dans le classement des mots, un grand nombre de spams ciblant la vente de médicaments en ligne, pratique courante en Amérique du nord. A noter cependant que 5 des 6 premiers mots sont suivis d’un point d’exclamation. Sans doute pour souligner l’urgence de l’annonce et éviter que l’internaute ne prenne le temps de réfléchir…(si seulement !).

En poussant l’étude plus loin et en classant les spams par source, soit le botnet à l’origine de l’envoi, se dessinent alors des spécialisations. Je rappelle qu’à ce jour, plus de 90% des spams sont envoyés par des botnets.

Voici pour BAGLE :

bagle

GRUM :

grum

RUSTOCK :

Rustock

BOBAX :

Rustock

Dans le cas des 4 botnets précédents, le nombre de mots reste limité car le but est d’inciter le lecteur à cliquer sur le lien associé, et le pousser à un achat, le plus vite possible. Plus de mots quand même pour Bobax, bien que le thème reste limité à un sujet précis…

un exemple ici :

sample

CUTWAIL

Folkspam

Beaucoup plus de mots dans ce dernier. En effet, la plupart des spams envoyés par Cutwail cherchent pousser l’internaute à ouvrir une pièce jointe, et ainsi infecter sa machine. Thèmes plus variés, textes plus élaborés pour paraître plus réels, souvent même copiés de sources légitimes.

Un Spécimen :

cutwail