Chaotischer Catalysator Stipendium

Workshop-Rückblick: Von politisch motivierten Datenlöschungen und kaputten Links

Anfang des Jahres ereilt ein Hilferuf aus den USA die Wissenschaft in Europa. Die Trump-Administration hat alle Mitarbeiter*innen des sechsten National Climate Assessment (NCA6) über Nacht entlassen. Ihre Arbeitsergebnisse, kommende Berichte und Datenbanken sind nur einen politisch motivierten Knopfdruck von der Löschung entfernt. Der Schrei wird erhört. Aktivist*innen und Institute spiegeln Datenbanken, Webseiten und Berichte um sie vor dem Verlust zu bewahren. Es ist nicht der erste Hilferuf aus den USA zu diesem Thema und wird nicht der Letzte sein. Diversitäts-, Wetter- und Covid-Daten verschwinden und werden gesichert. Ein Umdenken findet statt, denn die Wissenschaft ist vernetzt. Wer heutzutage forscht, der nutzt eben nicht nur Daten aus seinem eigenen Land, sondern ist auf internationale Daten angewiesen. Die Vorstellung, nur eine Wahl von wissenschaftlichen Verlusten entfernt zu sein wächst.

Wer unser Stipendiumsprojekt kennt, wird nicht überrascht sein, dass wir für Open Access und Offene Daten stehen. Wir publizieren die von uns geförderten Masterarbeiten aus Überzeugung frei zugänglich (wenn auch auf Grund unserer aktuellen Ressourcen vorerst nur als PDF in unserem Blog). Offene Daten können an mehreren digitalen Orten bereitgestellt (gespiegelt) werden. Es gibt einen guten Grund, warum Trump und andere rechte politische Gruppen Kürzungen in der Wissenschaft vornehmen: Eine faktenbasierte Wissenschaft ist auch Basis unserer Demokratie -- Umso wichtiger ist es, dass Wissen frei und zugänglich ist.

Doch wie steht es eigentlich um die Datenquellen der von uns geförderten Masterarbeiten? Und wie kann man selbst Datenverlust minimieren?

Claudia und Henrik sitzen an einem Tisch. Vor ihnen haben sie ihre mit bunten Stickern beklebte Laptops uns Wasserflaschen stehen.
Claudia Präsentiert stehend nicht erkenntliche Folien. Henrik sitzt daneben an seinem Laptop.

Dafür haben wir zu einem Workshop mit dem Titel "Shit. My data is gone." - On the Value of Being Unorthodox: Resilience in a Time of Hostility against Arts and Sciences eingeladen. Insgesamt 15 Teilnehmende sind unser Einladung ins über 30 Grad heiße Karlsruhe gefolgt, um Claudia Frick, Professorin für Informationsdienstleistungen und Wissenschaftskommunikation an der Technischen Hochschule Köln, und Henrik Schönemann, Aktivist bei Safeguarding Research & Culture als eingeladene Expert*innen zu lauschen.

Gemeinsam haben wir anhand mitgebrachter wissenschaftlicher Arbeiten überprüft, wie es um die referenzierten Quellen und erhobenen Daten steht und mussten feststellen: Jede*r kann mindestens eine Quelle nicht mehr aufrufen. Die Gründe dafür waren vielfältig.

  • Politisch motivierte Löschungen in den USA
  • Daten sind neuerdings hinter Geoblockern
  • Webserver-Konfigurations-Änderungen der Universität machen URLs nun case-sensitiv
  • Anti-Bot Maßnahmen blocken Zugriffe
  • DOIs sind keine "echten" DOIs und verschwunden
  • Institute und Universitäten haben durch Umbenennung Inhalte und Links verloren
  • Links auf direkte PDFs führen plötzlich ins Leere
  • Graue Literatur (Poster, Flyer, ...) wurde nicht gesichert oder digitalisiert
  • Ministerien wurden umbenannt und Links auf dortige Quellen sind zum Teil kaputt
  • Informationen und Ressourcen der öffentlich-rechtlichen Medien wurden aus Copyrightgründen depubliziert
  • Inhalte auf Seiten der Medienhäuser (Bloomberg, ...) sind nicht mehr verfügbar
  • Inhalte auf der referenzierten Internetseite haben sich geändert, sind jedoch nicht versioniert
Henrik steht mit einer Fernbedinung in der Hand neben einem Projektor. Die Folie im Hintergund zeigt die Begrüßung mit der Folie: Chaotischer Catalysator Stipendium Workshop. Nah an der Kamera sind die Köpfer der Teilnehmenden verschwommen zu erkennen.
Claudua steht neben dem Projektor. Die Folie im Hintergrund ließt 'Was für Quellen?' und 'Quellen gegeben?'

Schaut man einmal genau hin, entdeckt man schnell: Nicht nur politisch motivierte Daten verschwinden. Tatsächlich hat uns dieser Workshop auch noch mal vor Augen geführt, wie kurzlebig referenzierte Inhalte im Internet eigentlich sein können. Bereits bei nur 2 Jahre alten Masterarbeiten konnten wir "verlorene" Quellen feststellen.

Dabei sind die Daten und Ergebnisse meistens nicht vollständig aus dem Netz verschwunden. Oft ist "nur" der direkte Link nicht mehr gültig, oder Paper-PDFs nicht mehr dort zu finden, wo man dachte. Per Internet-Recherche, Wayback-Machine, oder auf weniger legalen Portalen, findet man häufig noch die gesuchten Inhalte.

Doch wissenschaftliche Ergebnisse sind nur so gut wie ihre Nachvollziehbarkeit.

Claudia schaut zwei Teilnehmerinnen von hinten über die Schulter. Die Teilnehmerinnen schauen auf ihren Laptop und sprechen mit Claudia.
Ein Laptop der vollgeklebt mit bunten Stickern ist. Zum Beispiel: 'Feminismus ist für jeden', 'Alle Sachen sollten reparierbar sein', 'Beschützt trans Kinder'

Daher möchten wir Folgendes für wissenschaftliche Arbeiten mit an die Hand geben:

  • Prüfe bereits bei der Recherche, aus welchen Ländern deine Daten / Quellen kommen und wie sie bereit gestellt werden, um das Risiko ihres Verschwinden einschätzen zu können
  • Gebe beim Zitieren zusätzliche Infos an, welche das Finden referenzierter Inhalte auch ohne Link ermöglichen
  • Mache eine Sicherheitskopie aller von dir referenzierten Daten und Quellen für dich persönlich. Dazu zählen alle Rohdaten, sowie Exporte der referenzierten Web-Inhalte.
  • Publiziere (sofern DSGVO-konform möglich) deine Datenbasis mit deiner Arbeit.

Als Stipendium müssen wir uns auch an die eigene Nase fassen: Unsere aktuelle Bereitstellung der Masterarbeiten ist nicht referenzierbar. Schon jetzt sind Quellen "verschwunden" -- zwei Jahre nach der Publikation unserer ersten Arbeit.

Zukünftig wollen wir uns als Aufgabe setzen, die Publikation unserer Masterarbeiten weiter zu optimieren. Zum Beispiel wollen wir prüfen, ob und in welcher Form wir DOIs oder Alternativen finanzieren können.

Aber nicht nur für uns gab es Denkanstöße: Das Feedback zeigt, dass alle Teilnehmenden etwas für sich und ihre Arbeit mitnehmen konnten. Ein voller Erfolg, der uns auch bestärkt, dass ein persönliches Treffen nicht nur zur Vernetzung wichtig ist, sondern auch Denkanstöße und Eindrücke vermitteln kann. Ein riesiges Dankeschön gilt dabei auch Claudia und Henrik für ihre Zeit und die Vorbereitung des Events.

Eine Gruppe Teilnehmer*innen sitzt in U-Form an Tischen. Sie schauen auf ihre Laptops.
Eine Person in der Mitte der Tisch-Gruppe spricht. Die anderen Teilnehmenden hören zu.

Und nimm du dir doch auch mal eines deiner früheren Paper vor, deine alte Diplomarbeit aus der verstaubten Schublade, oder schaue durch unsere veröffentlichte Publikations-Liste und prüfe nach: Sind deine Quellen und Belege noch aktuell? Welche Daten sind verschwunden? Welche Institute haben sich umbenannt? Und hat das die Verlinkung zerstört? Denn auch wenn es gerne heißt, das Internet vergesse nie, verschwinden digitale Quellen oft schneller als wir denken.

Wenn du informiert bleiben möchtest, wann wir unseren nächsten Workshops veranstalten, dann abonniere unseren Newsletter.