Wikipedia – Vorbote einer neuen digitalen Ungleichheit

Dass die Digitalisierung unserer Welt und unseres Alltags von einer neuen sozialen Ungleichheit begleitet wird, ist seit mindestens 20 Jahren bekannt. Unter dem Label digital divide, digitale Kluft erforscht die Sozialwissenschaft verschiedene Dimensionen digitaler Ungleichheit wie dem Zugang zum Internet oder die unterschiedlichen Computerkenntnisse. Aber während bei all diesen Themen Menschen, im Fachjargon menschliche Akteure, im Vordergrund stehen, mischen im Feld der Ungleichheit auch zunehmend künstlichen Intelligenzen und optimierte Menschen mit.

Nicht nur in extremen Beispielen, wie dem Computerprogramm AlphaGo, dem wohl besten Go-Spieler in der Geschichte technisierten Menschheit oder dem Künstler Neil Harbisson, der Farben hören kann, tritt diese neue Ungleichheit zu Tage. Nahezu unbemerkt ist sie über die Wikipedia bereits ein Teil unseres Alltags geworden.

Neil Harbisson 2012 – Dan Wilton/The Red Bulletin – https://www.flickr.com/photos/25958224@N02/8122856863 CC BY 2.0

Sowohl die Grösse der Wikipedia als auch die zumeist recht hohe Qualität der Artikel wäre ohne Computerprogramme, Bots, und halbautomatische Editierungssysteme, Gadgets, in dieser Form nicht möglich. Ein extremes Beispiel hierfür sind die Wikipedias der global eher unbedeutenden Sprachen Cebuano und in Schwedisch. Hauptsächlich durch automatisch generierte Artikel des bots Ljsbot sind diese beiden Sprachversionen, nach der englischsprachigen, die zweit und die dritt grösste Wikipedia vor der deutschsprachigen. Bots und halb-automatische Systeme spielen auch in den beiden anderen grossen Wikipedias* eine wichtige Rolle und sind eng verbunden mit dem Erfolg eines Benutzers innerhalb dieser.

Entgegen unseres alltäglichen Überzeugung, dass in der Wikipedia jeder alles schreiben könne, existiert innerhalb der Wikipedia eine formale soziale und technische Hierarchie, die jede Änderung in der Wikipedia streng überwacht. Der Aufstieg innerhalb dieser Hierarchie erfolgt über die Anzahl der Bearbeitungen und als Belohnung warten neben erweiterten Zugangsberechtigungen auch Orden. Bots sind nicht nur ein Teil dieser Hierarche, sondern tragen selbst zum Aufbau dieser Hierarchie bei. So werden die niedrigen Benutzerrollen autoconfirmed and extended confirmed User automatisch allen registrierten Benutzern von Programmen nach 10, bzw. 500 Bearbeitungen innerhalb 30 Tagen zugewiesen. Verbunden mit diesem sozialen Aufstieg ist eine Zunahme an Vertrauen. So dürfen diese Benutzergruppen halbgeschützte bzw. auch erweitert geschützte Seiten bearbeiten, die zum Schutz vor Vandalismus gesperrt worden sind.

Die Bekämpfung von Vandalismus ist neben der Erstellung von Artikeln eine der Hauptaufgabe der Wikipedia. Dabei wird unter Vandalismus eine böswillige Bearbeitung verstanden, die absichtlich einen Artikel zerstören soll und umfasst dabei Ergänzungen, Löschungen oder Änderungen, die entweder humoristisch, unsinnig, eine Falschmeldung oder verletzend sind. Vandalismus ist dabei ein Nebenprodukt des Anspruches, dass jeder die Wikipedia bearbeiten kann und Vandalismusbekämpfung Wikipedia´s Gegenreaktion, die es gestattet die Wikipedia zu reinigen ohne diesen Anspruch aufzugeben. So kann zwar jeder fast alles bearbeiten, aber Niemand garantiert, dass eine Änderung auch lange in der aktuellen Version verbleibt.

Die oben erwähnten Formen von geschützten Seiten spielen deswegen auch eine eher unbedeutende Rolle. In etwa 2000 von 5,7 Millionen Artikel oder 0,035 Prozent fallen in der englischen Wikipedia unter diese Kategorien. Erreicht wird dies durch die ständige Kontrolle durch Benutzer, unterstützt von halbautomatischen Systemen und Bots. In dem WikiProjekt Vandlismusbekämpfung werden diese koordiniert.

Mit annährend drei Millionen Bearbeitungen ist dabei ClueBot NG (Next Generation), der   wichtigste Bot in diesem System. In einem fünfstufigen Verfahren, bestehend aus maschinellen Lernen, einem naiven Bayes Klassifikator, einem künstlichen neuronalen Netzwerk, einer Schwellenwertkalkulation und einem Post-Verarbeitungsfilter verarbeitet der Bot aktuelle Bearbeitungen und klassifiziert und revidiert diese gegebenenfalls als Vandalismus. Die einzelnen Schritte laufen dabei grob wie folgt ab:

Anhand einer Liste von Bearbeitungen, die von menschlichen Vandalismusjägern entweder als konstruktiv oder als Vandalismus klassifiziert worden sind, lernt der Bot maschinell seine Definition von Vandalismus.

Der naive Bays Klassifikator beurteilt eine Liste von Wörtern anhand ihrer Häufigkeit in konstruktiven und destruktiven Bearbeitungen. Neben anderen Statistiken fließt dieses Ergebnis in dem Kern von ClueBot NG, dem künstlichen neuronalen Netzwerk, ein. In diesen Daten sucht es nach Mustern von Vandalismus. Als Ergebnis gibt das Netzwerk eine Vandalismuswahrscheinlichkeit aus. Ab einem bestimmten kalkulierten Schwellenwert wird dann eine Bearbeitung zunächst als Vandalismus gekennzeichnet.

Der Post-Verarbeitungsfilter gleicht dieses Ergebnis mit einer Liste vertrauenswürdiger Benutzer (Whitelist) und dem Verhältnis zwischen angenommenen und verwarnten Bearbeitungen eines Nutzers ab. Des Weiteren bestimmt dieser Filter, dass nur eine Benutzer-Seiten-Kombination pro Tag revidiert wird.

Wie alle Bots ist dabei ClueBot Ng über seine Autoren und das Bots/Antrag auf Zulassung-Verfahren in die Hierarchie der Wikipedia eingebunden. Nach einem komplizierten Verfahren, zu dem auch eine für alle offene Diskussion gehört, werden Bots durch ein Mitglied der Bot-Zulassungsgruppe entweder zugelassen oder abgelehnt. Die Mitglieder dieser Gruppe sind in aller Regel ranghohe Administratoren oder von ihrem Status und Rechten mit ihnen vergleichbar.

ClueBot NG ist aber besonders stark mit der Hierarchie der Wikipedia verflochten. So werden in den Verarbeitungsschritten maschinelles Lernen und künstliches neuronales Netzwerk die Ansichten der menschlichen Vandalismusjägern reproduziert. Somit werden auch ihre Vorurteile nicht nur reproduziert, sondern in ihrer Wirkung noch verstärkt. Dies ist einer der Gründe warum deutlich weniger Frauen, je nach Wikipedia zwischen 3 und 17 Prozent, und deutlich weniger people of color zur Wikipedia beitragen als weisse Männer.

Huggle: By Petrb – Own work, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=33194849

Die halb-automatischen Anti-Vandalismus-Tools Rollback, Twinkle und Huggle sind noch stärker mit der Hierarchie Wikipedia´s verbunden. Während ClueBot NG selbständig Vandalismus revidiert, geben diese Tools Benutzern eine Liste von verdächtigen Bearbeitungen, die dann, häufig einfach per Mausklick, von den Benutzern geprüft und gegebenenfalls revidiert werden. Dabei ist die Nutzung dieser Tools direkt an den sozialen Status gebunden. So bedarf die Nutzung von Twinkle den autoconfirmed Status und die Kontrolle über Rollback und Huggle und ihre Nutzung ist Administratoren vorbehalten.

Die digitale Ungleichheit, die solche Tools dabei produzieren, ist enorm. Denn nur mit Hilfe solcher Werkzeuge kommen die sehr hohen Bearbeitungszahlen mancher Benutzer zustande. So steuert der Benutzer Ser Amantio di Nicolao, der Wikipedianer mit den derzeit meisten Bearbeitungen, mit ihrer Hilfe auf 2,7 Millionen Bearbeitungen zu.

Digitale und soziale Ungleichheit bedingen sich in der Wikipedia in einem selbstverstärkenden Zirkel gegenseitig. Mehr Bearbeitungen, höherer sozialer Status, Zugang zu halb-automatischen Werkzeugen, mehr Bearbeitungen, höherer sozialer Status und so weiter ist die Logik, nach der die Wikipedia funktioniert. Diese Ungleichheit bestimmt dabei was in der Wikipedia steht und damit in vielen praktischen Belangen als Wissen gilt. So sind einige Themen, wie die afroamerikanische Geschichte oder bedeutende Frauen in der Wikipedia unterrepräsentiert. Aber vielmehr als klassische Ungleichheiten zu reproduzieren ist Wikipedia ein Vorbote einer neuen Ungleichheit zwischen Menschen, digital verbesserten Menschen und künstlichen Intelligenzen, die zunehmend auch den Arbeitsmarkt ergreift. Denn egal welches Geschlecht, ohne digitales Upgrade kann man sich bereits jetzt in der Wikipedia nur schwer durchsetzen.

Philipp Adamik, September 2018

*Die Links verweisen auf die englische Wikipedia. In der Regel gelangt man über einen Link in der linken Spalte zum deutschsprachigen Äquivalent.

Der Artikel wurde auch hier in der Communty des Freitags veröffentlicht.

Titelbild: HAL 9000 Computergehäuse. Illustration basierend auf dem Film 2001 – A Space Odyssey von Stanley Kubrick. Grafiker61CC BY-SA 4.0

Leave a Reply