Einblicke in die Produktion von Machine Learning-Datensets

Neuer Artikel: On the genealogy of machine learning datasets: A critical history of ImageNet

Beeindruckt hat uns eine tolle Arbeit von Kolleginnen und Kollegen aus den USA, welche die „Datenarbeit“ hinter der Produktion von Machine Learning genauer unter die Lupe genommen hat, konkret am Beispiel der größten globalen Bilderdatenbank im Netz: ImageNet. Der Artikel der ForscherInnen Denton, Hanna, Amironesei, Smart und Nicole zeigt sehr anschaulich, an welchen Stellen über vermeintlich kleine Entscheidungen folgenschwere Wirkungen für die Modellierung der Datenbank und damit für die erzeugte „Sichtbarkeit“ von Welt entstehen. Auch weist der Beitrag auf eine bislang noch extrem unterschätzte Praktik beim Erstellen von Machine Learning-Datensets hin: unbezahlte crowdwork. Der Artikel ist online frei zugänglich.

Hier geht es zum artikel