Workshop-Rückblick: Von politisch motivierten Datenlöschungen und kaputten Links
Anfang des Jahres ereilt ein Hilferuf aus den USA die Wissenschaft in Europa. Die Trump-Administration hat alle Mitarbeiter*innen des sechsten National Climate Assessment (NCA6) über Nacht entlassen. Ihre Arbeitsergebnisse, kommende Berichte und Datenbanken sind nur einen politisch motivierten Knopfdruck von der Löschung entfernt. Der Schrei wird erhört. Aktivist*innen und Institute spiegeln Datenbanken, Webseiten und Berichte um sie vor dem Verlust zu bewahren. Es ist nicht der erste Hilferuf aus den USA zu diesem Thema und wird nicht der Letzte sein. Diversitäts-, Wetter- und Covid-Daten verschwinden und werden gesichert. Ein Umdenken findet statt, denn die Wissenschaft ist vernetzt. Wer heutzutage forscht, der nutzt eben nicht nur Daten aus seinem eigenen Land, sondern ist auf internationale Daten angewiesen. Die Vorstellung, nur eine Wahl von wissenschaftlichen Verlusten entfernt zu sein wächst.
Wer unser Stipendiumsprojekt kennt, wird nicht überrascht sein, dass wir für Open Access und Offene Daten stehen. Wir publizieren die von uns geförderten Masterarbeiten aus Überzeugung frei zugänglich (wenn auch auf Grund unserer aktuellen Ressourcen vorerst nur als PDF in unserem Blog). Offene Daten können an mehreren digitalen Orten bereitgestellt (gespiegelt) werden. Es gibt einen guten Grund, warum Trump und andere rechte politische Gruppen Kürzungen in der Wissenschaft vornehmen: Eine faktenbasierte Wissenschaft ist auch Basis unserer Demokratie -- Umso wichtiger ist es, dass Wissen frei und zugänglich ist.
Doch wie steht es eigentlich um die Datenquellen der von uns geförderten Masterarbeiten? Und wie kann man selbst Datenverlust minimieren?


Dafür haben wir zu einem Workshop mit dem Titel "Shit. My data is gone." - On the Value of Being Unorthodox: Resilience in a Time of Hostility against Arts and Sciences eingeladen. Insgesamt 15 Teilnehmende sind unser Einladung ins über 30 Grad heiße Karlsruhe gefolgt, um Claudia Frick, Professorin für Informationsdienstleistungen und Wissenschaftskommunikation an der Technischen Hochschule Köln, und Henrik Schönemann, Aktivist bei Safeguarding Research & Culture als eingeladene Expert*innen zu lauschen.
Gemeinsam haben wir anhand mitgebrachter wissenschaftlicher Arbeiten überprüft, wie es um die referenzierten Quellen und erhobenen Daten steht und mussten feststellen: Jede*r kann mindestens eine Quelle nicht mehr aufrufen. Die Gründe dafür waren vielfältig.
- Politisch motivierte Löschungen in den USA
- Daten sind neuerdings hinter Geoblockern
- Webserver-Konfigurations-Änderungen der Universität machen URLs nun case-sensitiv
- Anti-Bot Maßnahmen blocken Zugriffe
- DOIs sind keine "echten" DOIs und verschwunden
- Institute und Universitäten haben durch Umbenennung Inhalte und Links verloren
- Links auf direkte PDFs führen plötzlich ins Leere
- Graue Literatur (Poster, Flyer, ...) wurde nicht gesichert oder digitalisiert
- Ministerien wurden umbenannt und Links auf dortige Quellen sind zum Teil kaputt
- Informationen und Ressourcen der öffentlich-rechtlichen Medien wurden aus Copyrightgründen depubliziert
- Inhalte auf Seiten der Medienhäuser (Bloomberg, ...) sind nicht mehr verfügbar
- Inhalte auf der referenzierten Internetseite haben sich geändert, sind jedoch nicht versioniert


Schaut man einmal genau hin, entdeckt man schnell: Nicht nur politisch motivierte Daten verschwinden. Tatsächlich hat uns dieser Workshop auch noch mal vor Augen geführt, wie kurzlebig referenzierte Inhalte im Internet eigentlich sein können. Bereits bei nur 2 Jahre alten Masterarbeiten konnten wir "verlorene" Quellen feststellen.
Dabei sind die Daten und Ergebnisse meistens nicht vollständig aus dem Netz verschwunden. Oft ist "nur" der direkte Link nicht mehr gültig, oder Paper-PDFs nicht mehr dort zu finden, wo man dachte. Per Internet-Recherche, Wayback-Machine, oder auf weniger legalen Portalen, findet man häufig noch die gesuchten Inhalte.
Doch wissenschaftliche Ergebnisse sind nur so gut wie ihre Nachvollziehbarkeit.


Daher möchten wir Folgendes für wissenschaftliche Arbeiten mit an die Hand geben:
- Prüfe bereits bei der Recherche, aus welchen Ländern deine Daten / Quellen kommen und wie sie bereit gestellt werden, um das Risiko ihres Verschwinden einschätzen zu können
- Gebe beim Zitieren zusätzliche Infos an, welche das Finden referenzierter Inhalte auch ohne Link ermöglichen
- Mache eine Sicherheitskopie aller von dir referenzierten Daten und Quellen für dich persönlich. Dazu zählen alle Rohdaten, sowie Exporte der referenzierten Web-Inhalte.
- Publiziere (sofern DSGVO-konform möglich) deine Datenbasis mit deiner Arbeit.
Als Stipendium müssen wir uns auch an die eigene Nase fassen: Unsere aktuelle Bereitstellung der Masterarbeiten ist nicht referenzierbar. Schon jetzt sind Quellen "verschwunden" -- zwei Jahre nach der Publikation unserer ersten Arbeit.
Zukünftig wollen wir uns als Aufgabe setzen, die Publikation unserer Masterarbeiten weiter zu optimieren. Zum Beispiel wollen wir prüfen, ob und in welcher Form wir DOIs oder Alternativen finanzieren können.
Aber nicht nur für uns gab es Denkanstöße: Das Feedback zeigt, dass alle Teilnehmenden etwas für sich und ihre Arbeit mitnehmen konnten. Ein voller Erfolg, der uns auch bestärkt, dass ein persönliches Treffen nicht nur zur Vernetzung wichtig ist, sondern auch Denkanstöße und Eindrücke vermitteln kann. Ein riesiges Dankeschön gilt dabei auch Claudia und Henrik für ihre Zeit und die Vorbereitung des Events.


Und nimm du dir doch auch mal eines deiner früheren Paper vor, deine alte Diplomarbeit aus der verstaubten Schublade, oder schaue durch unsere veröffentlichte Publikations-Liste und prüfe nach: Sind deine Quellen und Belege noch aktuell? Welche Daten sind verschwunden? Welche Institute haben sich umbenannt? Und hat das die Verlinkung zerstört? Denn auch wenn es gerne heißt, das Internet vergesse nie, verschwinden digitale Quellen oft schneller als wir denken.
Wenn du informiert bleiben möchtest, wann wir unseren nächsten Workshops veranstalten, dann abonniere unseren Newsletter.