Digital sozialisiert, Denker, Macher und Angel Investor.

ArchiveMärz 2026

KI trainiert KI: Synthetische Daten sind die nächste strategische Ressource

K

Unter dem Titel «Generating Trillions of the Finest Tokens» dokumentiert Hugging Face ein grossangelegtes Experiment zu synthetischen Daten. Aber zuerst zur Frage, weshalb es synthetische Daten überhaupt braucht? Die Datenquelle Internet ist ausgetrocknet Frühe Sprachmodelle wurden mit Quellen wie Wikipedia (ca. 7 GB) oder dem Projekt Gutenberg (ca. 12 GB) trainiert. Doch rasch wurde alles, was...

Digital sozialisiert, Denker, Macher und Angel Investor.