Trackback-SPAM einfach und effektiv verhindern
Vor einigen Tagen hatte ich eine Idee, wie man Trackback-SPAM wirkungsvoll und wie ich denke absolut risikolos verhindern kann. Zwar ist der Trackback-SPAM bei mir zur Zeit stark rückläufig. (Zumindest der automatische. Von den Hommigberger-Gepardenforellen-SEOs will ich hier lieber nicht sprechen.) Allerdings denke ich, es ist nur eine Frage der Zeit ist, bis die nächste Trackback-SPAM-Welle rollen wird. Da kann es sicher nicht schaden, sich darauf vorzubereiten.
Daher habe ich mir heute während meines Mittagessens mal eine Spezifikation von Trackbacks durchgelesen und dort genau das gefunden, was ich gesucht habe:
The central idea behind TrackBack is the idea of a TrackBack ping, a request saying, essentially, "resource A is related/linked to resource B."
Ehrlich gesagt habe ich auch schon viele Trackbacks bekommen, die zwar von Seiten kamen, die das selbe Thema behandelt haben, mich aber nicht verlinkt haben. Und daher wollte ich in diesem Punkt einfach nur nochmal sicher gehen. Denn genau hierauf beruht meine Idee:
Wenn ein Trackback für eine gewisse Seite eingeht, so bedeutet dies, dass von der getrackten URL ein Link zu mir existieren muss. Als Trackback-Empfänger kann ich also völlig problemlos diese Seite aufrufen und nachschauen, ob dieser Link existiert. Wenn nicht, wird der Trackback abgewiesen.
Sicherlich kann der Spammer dort vorübergehend einen Link setzen um so diese Prüfung zu umgehen. Allerdings bedeutet das auch, dass sein Server die selbe Anzahl von Request pro Zeiteinheit verarbeiten können muss, wie er versucht Trackbacks zu senden. Während das Senden über gekaperte Dialups verteilt werden kann, ist eine Verteilung auf dem Webserver schon bedeutend schwieriger und vor allem teuer. Sendet er zu viele Trackbacks initiiert er dadurch quasi seinen eigenen DDoS.
Zusätzlich könnte man die Prüfung in unregelmäßigen Abständen noch ein paar Mal wiederholen. Also beispielsweise direkt nach dem Senden, nach fünf Minuten, nach einer halben Stunde, nach 12 Stunden, nach zwei Tagen. Dies würde den Spammer daran hindern die Links nach einer gewissen Zeit wieder zu entfernen und wurde bei Massen-Trackback-Spamming den DDoS auf einen längeren Zeitraum ausdehnen. Voraussetzung hierfür wäre lediglich ein Cronjob auf dem Server, was es heute schon bei vielen Hosting-Paketen gibt, oder aber das "Aufheben" der Prüfung bis diese von einem PHP/Perl/Pyton/etc.-Skript durchgeführt werden kann, das sowieso gerade einen Request (z.B. den Abruf einer Seite) bearbeitet.
Nicht verhindern würde es manuellen Trackbach-SPAM, bei dem die Links wirklich auf der Sendersete gesetzt werden. Dies dürfte jedoch vernachlässigbar sein und kann manuell problemlos bewältigt werden.
Was denkt ihr? Würde solch ein System etwas bringen?
Links:
A Beginner's Guide to TrackBack
TrackBack Technical Specification
Update:
Auch ein Trackback-Service wie bei MEX gerade gelesen, würde damit klappen, da durch das erste Senden des Hin-Trackbacks die eigene URL in den "Trackbacks-von-Links" auftauchen und somit auch der Rück-Trackback durchgehen würde. Alternativ könnte man gewisse Domains natürlich für solche Services auch manuell von der Prüfung ausnehmen.
Geschrieben von Jan Theofel am 2.05.2005 um 11:44 Uhr (Permalink)
Abgelegt unter Blogs
1 | Wolfgang Sommergut | 2.05.2005 um 17:47