Sonstiges

Akismet: Tool gegen Spam und die Krux mit False Positives

Akismet ist ein Antispam Tool und wird mW nur in WordPress-Blogsystemen eingesetzt (Update: ist nicht korrekt, siehe Hinweis unten). Es gleicht bei jedem Kommentar und Trackback/Pingback die im Freitextfeld und dem entsprechenden URL-Formularfeld enthaltenen URLs mit einer zentralen Datenbank ab, die sämtliche, erfassten Spam-URLs listet. Das Schöne an diesem Vorgehen: zahlreiche WordPress-Blogs nutzen das Tool und sobald eine neue Spam-URL irgendwo aufschlägt, ist sie global allen anderen WP-Blogs bekannt. Zusätzlich kann der Blog-Admin händisch Einträge als Spam deklarieren. Ebenso kann er auch sog. „False Positives“ wieder demarkieren, bevor sie fälschlicherweise im Spam-Nirvana landen. Und genau da liegt mein wachsendes Handling-Problem:

mittlerweile werden immer mehr saubere Blog-URLs von Akismet als Spam klassifiziert. Und wenn man diese False Positives unter 100 Spameinträgen wieder rausfischen möchte, dauert es halt. Je größer aber die Quote der False Positives wird, nimmt das immer mehr Zeit in Anspruch. Insbesondere dann, wenn wieder mal 100-1000 Spameinträge im Akismet-Menue herumschwirren, kann man sich vorstellen, wie lange es dauer, bis man 10-50 False Positives herausfischt. Ich habe zumindestens den Eindruck, dass es immer mehr werden.

Wie man nun dummerweise bei Akismet in der Blacklist im Detail aufschlägt, weiß ich nicht. Verstehen tue ich das auch nicht so ganz. Gibt es Blogger, die absichtlich echte URLs mit Hilfe Akismet als Spam klassifizieren oder wo kommt dieser Mist her?

Auf jeden Fall erweist sich ein weiteres Tool als sehr nützlich, sehr zügig -rein visuell gesehen- die False Positives herauszufischen: SpamViewer 0.93 von Frank Bueltge. Aufgrund der layouttechischen Anordnung ist es das imho beste Tool für diese Aufgabe.

Update: Akismet wird nicht nur in WP Blogs eingesetzt, sondern kann Dank zugänglicher API von allen CMS Alternativen eingebunden werden, so zB gibt es ein Akismet-Plugin für S9y (ein Blogsystem). Danke für die Hinweise!

Jobs in der IT-Branche


Über den Autor

Robert Basic

Robert Basic ist Namensgeber und Gründer von BASIC thinking und hat die Seite 2009 abgegeben. Von 2004 bis 2009 hat er über 12.000 Artikel hier veröffentlicht.

26 Kommentare

  • Hi Robert,

    mittlerweile werden immer mehr saubere Blog-URLs von Akismet als Spam klassifiziert.

    Kann ich jetzt so nicht bestätigen.

    Gibt es Blogger, die absichtlich echte URLs mit Hilfe Akismet als Spam klassifizieren oder wo kommt dieser Mist her?

    Ich habe die Erfahrung gemacht, dass Leute die „falsche“ Trackbacks verschicken (also Trackback ohne den Hinweis im Beitrag auf die zu trackbackende Seite) auch des öfteren von Akismet als Spam deklariert werden.

    Und wenn man die von dort nicht rausfischt, dann bleiben die halt dort. Ich habe mir früher die Mühe gemacht solche Websites aus dem Spam-Ordner zu entfernen, aber mittlerweile auch nicht, weil einige Konsorten schlichtweg dreist sind.

  • Meine Theorie ist, dass Spammer absichtlich false positives einführen, um möglichst viele Blogger davon abzubringen, Akismet zu benutzen. Vielleicht ist das aber nur meine Paranoia 😉

  • Ich benutze seit einiger Zeit CJD Spam Nuke. Man hat hier mehr Übersicht, weil ähnliche Comments zusammengefasst werden (Autor, mail, url). Diese lassen sich dann zusammengefasst löschen.

  • @Robert
    Auch Serendipity setzt auf Wunsch Akismet ein. Akismet ist dabei im globalen Spamschutz-Plugin integriert und muss nur durch Eingabe des Akismet-Keys aktiviert werden.

    Meine Blogadresse wurde von Akismet auch schon mal als Spam deklariert. Das war aber glücklicherweise schnell wieder erledigt.
    Vielleicht sollte man mal direkt bei den Machern des Tools nachfragen, wie man so etwas vermeiden kann.

  • Ich habe zwei relativ kleine Blogs. Das hinter meinem Namen hier und noch ein persönliches. Und mich nervt das ganze Spamhandling jetzt schon. Ich kann nur ahnen, wie es bei Blogs in der Größenordnung von Deinem, Robert, abgeht.
    Wenn das so weiter geht, dürfte in spätestens 5 Jahren die Möglichkeit, unregistriert zu kommentieren, sich erledigt haben. Das wird irgendwann einfach nicht mehr tragbar sein.

    Aufwand/Nutzen.

  • Also im Kampf gegen Spam kann ich das Plugin SpamKarma empfehlen. Ich hatte bisher keinen einzigen Spam-Eintrag mehr in meinem Blog. „False Positives“ habe ich auch noch nicht gehabt (über 9 Monate im Betrieb). Es ist eine super Alternative zu Akismet

  • Ich kann pcn nur zustimmen: Im Blog und auf meinen anderen mit WP erstellten Seiten habe ich mit Spam-Karma täglich > 100 correct positives (wenn es diesen Begriff gibt :-). Und auch seit Monaten nicht einen false negative. Alle paar Tage mal einen Kommentar, den ich zum moderieren vorgelegt bekomme.

    Askimet gibt es auch für phpBB und Phorum; Serendipity wurde hier ja bereits ebenfalls erwähnt

  • ..und nicht zu vergessen, für Drupal gibt es auch ein Modul, mit dem man Askimet nutzen kann. Läuft bei mir ganz gut, habe aber auch kaum Kommentare.

  • […] wenn man, wie robert basic, mit richtig vielen spam kommentaren zu kämpfen hat, werden wohl auch ein paar nicht-spam-kommentare gefiltert, was natürlich lästiges geklicke zu folge hat. WP – SpamViewer soll bei der überprüfung ob ein als spam deklariertes kommentar nun wirklich spam ist – zumindest grafisch – unter die arme greifen. […]

  • @ Robert & Interessierte/Wissende:

    Ich verwende wie in meinem Blögchen das MathCommentSpamProtection Plugin und hatte in letzter Zeit immer mehr SPAM-Kommentare, die durchschlüpften.

    Wollte mich nur erkundigen, ob Du/ihr ähnliche Erfahrungen gemacht habt.

    Grüße,

    Andreas

    PS: Trackback war zu Testzwecken natürlich deaktiviert, es handelt sich um Kommentare.

  • @Perun:

    mittlerweile werden immer mehr saubere Blog-URLs von Akismet als Spam klassifiziert.

    Kann ich jetzt so nicht bestätigen.

    Tja, ich habe mir eine neue TLD zugelegt grade weil alle Kommentare die ich unter neun12.DE abgebe von Akismet aussortiert werden.

    @Farlion:

    Meine Blogadresse wurde von Akismet auch schon mal als Spam deklariert. Das war aber glücklicherweise schnell wieder erledigt.
    Vielleicht sollte man mal direkt bei den Machern des Tools nachfragen, wie man so etwas vermeiden kann.

    Die „Macher“ meinen es würde reichen wenn die Kommentare als False Positives gekennzeichnet würden. Das kann ich allerdings nicht bestätigen. Hat Akismet einen mal so richtig auf den Kieker, dann kann man seine URL verbrennen.

    SpamKarma ist die Pest. Verbraucht unendlich viel Ressourcen und filtert nach einer Zeit kaum noch was raus.
    MathCommentSpamProtection und SimpleTrackbackDings hatte ich auch im Einsatz. Beide hielten ganz gut stand, allerdings landeten trotzdem noch etliche Trackback-Spams in der Datenbank. So doof sind die Spammer mittlerweile auch nicht mehr.

    Die einzig wahre Lösung gegen Spam (meine Erfahrung): Anmeldung zum kommentieren nötig und Trackbacks abschalten.
    Wünschenswert wäre es wenn man OpenID in WordPress integrieren könnte. Dann wäre das mit den Anmelden zum kommentieren auch nicht mehr so ein Umstand.

  • Akismet ist für alle bekannten Blog-Systeme vorhanden, nicht nur WordPress, und kann auch mittels API in beliebige Systeme eingebaut werden, schau Dir mal akismet.com/development an. Mittlerweile gibt es auch für so ziemlich jede bekannte Programmiersprache schon Libraries, die man noch einfacher integrieren kann.

  • Viele false positives diskreditieren das Tool. Kann also gut sein, dass hier Spammer in die Suppe spucken.

    Schließlich musstest Du auch mein Tackback mal rausfischen und ich habe eine sehr weiße Weste und bin Deinem Blog gut bekannt. Backlinks sind ebenfalls i.a. Regel vorhanden. Alles in allem also kein Grund für Akismet meine Trackbacks in die Spamkiste zu packen.

  • Erlaube mir eine kleine Berichtigung zur Berichtigung. Das andere Blogsystem heisst nicht S9 sondern S9y in der Abkürzung (bzw. „Serendipity“ in der Langfassung).

    Zum Thema: Ich habe vor einiger Zeit ein Stöckchen herumgeschickt, in dem auch die Frage nach gemeinsamen Programmiervorhaben unterschiedlicher Blogsysteme gestellt wurde. Mehrheitlich war die Antwort, dass man sich eine gemeinsame Lösung für Spamabwehr überlegen und anbieten sollte, die in alle Blogsystem integrierbar ist.

    Ich habe seit drei Tagen das andere Problem, nämlich das Akismet Spams durchlässt. Aber das wird es wohl immer geben, da die Spammer immer neue Ideen haben.

  • Spam Karma mag ein Ressourcenfresser sein (kommt auf die Zahl der Spams an), aber es hat einige nicht zu unterschätzende Vorteile. Ich habe das bei mir so eingestellt, dass man mit Javascript schon mal ein dickes Plus bekommt und ohne ein dickes Minus. Akismet habe ich vollkommen aus der Gleichung entfernt, da es wie Robert schon schreibt, zu viele Kommentare falsch klassifiziert. Und dann bietet Spam Karma ja noch an ein Captcha anzuzeigen, wenn man nur knapp im Minus ist. Das alles gut eingestellt und aufeinander abgestimmt hält 100% des Spams fern und lässt jeden echten Menschen durch, der kommentieren will.

    Leider wird Spam Karma schon ewig nicht mehr weiterentwickelt, aber noch ist es das beste Tool. Auch die Übersicht über die Spams und der Grund warum was wie bewertet wurde ist transparenter als bei Akismet. Matt (der WordPress-Matt) meint da nur, dass es eben einfacher ist einfach nur Spam bzw. Ham ohne Begründung zurückzugeben … die Leute wollen einfach. Ha! Ich will Transparenz! 😉

  • Danke für den Link. Zwar hält sich die Anzahl der False Positives bei SK2 + Askimet in Grenzen, dennoch kann ich nicht ausschließen, dass da ab und an etwas durchrutscht. Inbesondere, wenn man ein paar Tage mal nicht 100% online war.

    Weiss eigentlich jemand wie man durch Askimet falsch klassifizierte Hams zu Spam umwandeln kann?

  • Hallo Robert,
    SpamViewer ist in einer neuen Version verfügbar, da es im Layout Probleme gab, sobald bestimmte html-Tags in den Kommentaren waren. Ist nun gefilltert.

    LG Frank

  • Da wir von ARGR letzte Woche auf Drupal umgestellt haben, kann ich dazu auch ein bisschen was sagen…

    Für Drupal gibt es zwar auch ein Akismet Modul, aber dort werden bislang lediglich Kommentare auf Spam überprüft. Trackbacks sind bislang nämlich nur mit einem eigenständigen Modul unter Drupal möglich und darauf greift das Akismet Modul in der aktuellen Version halt noch nicht zu. Das bedeutet letztendlich, dass man täglich mehrere tausend Spam-Trackbacks von Hand löschen muss, leider.

    Aber ich hoffe, daß die bereits stattfindenden Diskussionen zu diesem Thema auf der Drupal-Seite eine neue Version des Akismet-Moduls, bzw des Trackback-Moduls hervorbringen wird, in dem eben auch solcher Spam überprüft und entsprechend abgelehnt werden kann.

    @Holli: Ja du hast Recht, bei mehreren Tausend Trackback-Spams klickt man schon mal völlig entnervt auf Alles Markieren und dann auf Alles löschen, was in der Warteschlange steht.

  • Ich verwende Akismet unter Drupal (witzigerweise mit WordPress Key) in meinem WiiClub.de. Seltsamerweise landen alle Kommentare und Posts von einem speziellen User (out of 140) immer im Spameimer. Mir scheint der hat ein Problem mit seinem Provider (nutzt Akismet die IP Range !?).

    Anyway ist es echt anstrengend die „ham“s rauszusortieren…

    @Patrick: Akismet unter Drupal prüft auch nodes! Trackbacks sind allerdings wirklich die Hölle 🙂

  • […] zu gestalten. Viele von diesen sollte man auch auf jeden Fall installiert haben, wie zum Beispiel Askimet welches zuverlässig vor Kommentar-Spam schützt. Aber diese weiteren Plugins hier […]

Kommentieren