Natürlich aus rein wissenschaftlichem Interesse. Im Rahmen der Enron Untersuchung in den USA wurden von der Federal Energy Regulatory Commission 619’446 E-Mail Nachrichten von 158 Usern (meist Kadermitarbeiter) öffentlich publiziert. Diesen Korpus gibt es bei der Carnegie Mellon Universität zum Download und ist ein guter Grund, seine privaten E-Mails nicht übers Geschäft zu “pflegen”… oder suchen sie mal nach “marry me” drin 😉
Spannend sind die verfügbaren Auswertungen darauf so auch unterschiedliche statistische Klassifizierung oder gleich eine interaktive Navigation.
Sehr nett natürlich die Möglichkeit die Daten selbst als Testdatenset (z. B. auch für DBMS-Test) zu nutzen (ohne “wissenschaftliche” Papers generieren zu müssen).
Danke an Martin für den spannenden Tipp.
Fremde E-Mails lesen
F