Digital sozialisiert, Denker, Macher und Angel Investor.

E-Mail Adressen verstecken und doch nicht

E

Über E-Mail Spam brauche ich kaum zu klagen – der ist ihnen wahrscheinlich bestens bekannt. Doch wie kommen die Spammer an die E-Mail Adressen?

Die erste Strategie ist raten nach Zufallsprinzip so wie bei Passworten (brute force name guessing) oder raten mit Hilfe von Wörterbüchern. Somit sind kurze, einfache Adressen wie john@hotmail.com schlecht und ein Name wie juerg.stuker gut (weil selten).

Die zweite, deutlich erfolgreichere Strategie ist das Einsammeln von E-Mail Adressen auf Webseiten und in öffentlichen Verzeichnissen. Dies geschieht mit spezialisierten Programmen sog. Spiders oder Crawlers. Solche welche auch von Suchmaschinen genutzt mit dem (legitimen) Ziel zu indizierende Seiten zu beschaffen. Der «Erfolg» einer solchen Massnahme erlebte ein Mitarbeiter bei uns, welcher eine Frage auf E-Mail Liste publiziert hatte und am nächsten Morgen (und jeden Tag danach) über 200 Spams erhielt.

Was tun? E-Mail Adressen nicht zu publizieren wäre effizient, aber nicht besonders realistisch. Einige Ansätze:

  1. Ein Bild anstelle der E-Mail-Adresse oder anstelle des @-Zeichen, welches der Crawler braucht und Adressen aufzufinden. Nachteil ist, dass ein Klick mit à–ffnung des E-Mail Progranmmes (mailto:) nicht tut oder nur in Verbindung mit Ansatz 4. Achtung im ALT-Attribut die Adresse nicht angeben, weil der Crawler den Text lesen würde. Am besten wäre das Bild auch resistent gegen eine Texterkennung, so wie bei einem Captcha, doch das ist eher der Königweg. Dieser Weg ist nicht Barrierefrei.
    i-976906dedd805bc960acdd3bccdb3ee2-e-mail-adresse.gif
  1. Die Darstellung der E-Mail Adresse in einer HTML-Tabelle, so dass der Crawler den Zusammenhang der einzelnen Adress-Elemente nicht automatisch erkennen kann. Die Einschränkungen vom Ansatz 1) gelten auch hier.
juerg.stukerE-Mail nicht am Stück
@namics.com
  1. Das @-Zeichen als Text ausschreiben oder überflüssigen Text an die E-Mail Adresse anhängen.
    juerg.stuker (ät) namics.com
    juerg.stuker@namicsREMOVE.com
  1. Und dann noch eine Mischung von 3) mit JavaScript bei welcher der sichtbare Text ohne @-Zeichen steht und auf ein Klick wird der mailto-Link so zusammengesetzt dass der Crawler dies nicht versteht. Am einfachsten beim Kundenbeipiel www.erdgas.ch studieren. Der Weg ist der beste im Bezug auf Barrierefreiheit.

    Nicht genügend ist der Ersatz eines einzelnen Zeichens durch ein HTML Entität und/oder eine Unicode-Zeichen, da die Übersetzung sehr einfach erfolgen kann.

    Auf der gemeinen Seite – und Thema für einen eigenen Post – sind Fallen (honeypots) für Crawler die sich nicht an die Ausschlussreglen von robots.txt halten. Dabei werden zufällige (ungültige) E-Mail Adressen oder endlose Seiten erzeugt… Dies ist aber eher für «Liebhaber».

Und hier je noch einen Post über Greylisting und E-Mail Authentifizierung.
Mehr Infos auf den Internet auch bei: http://www.turnstep.com/Spambot/

4 Kommentare

Digital sozialisiert, Denker, Macher und Angel Investor.