Wissenschaftlich fundiert und auch einfach erklärt, doch deutlich spannender ist der Unterhaltungswert. Rechtschreibeprüfungen nutzen unter anderem die Worttrennung (Decompounding) und der Editierabstand (Levenstein distance) um ähnliche Schreibweisen als Korrekturvorschläge zu machen.
Im folgenden Beispiel (Microsoft Word 2003 mit Schweizer(deutsches) Wörterbuch hält der Algorithmus alles vor und nach dem Bindestrich fest und «spielt» mit dem Wort Meta, welches das Wörterbuch offensichtlich nicht kennt. Und was kommt das raus?
HTML-Mega-Tags: Muss was grössere sein?
HTML-Beta-Tags: Davon gibt es im Web 2.0 viele!!
HTML-Mett-Tags: Kenn ich nicht, kenne nur Mettwurst
HTML-Eta-Tags: Hmm sind das die aus dem Baskenland oder auch Grenchen?
Danke Reto für Hinweis und den Kommentar.
Worttrennung und Editierabstand = Unterhaltung
W