Open Science bei der iDAI.world – Im Interview: Dr. Benjamin Ducke

von Feb 6, 2019CC BY-SA, CC0, Offene Lizenzen, Restriktive Lizenzen

Foto_Benjamin_Ducke

(c) Paulina Suchowska 2012

Dr. Benjamin Ducke

Nach dem Studium der Ur- und Frühgeschichte, Klassischen Archäologie und Informatik an der Freien Universität Berlin promovierte Herr Ducke zum Thema „archäologische 4D-Datenanalyse“ an der Christian-Albrechts-Universität zu Kiel. Er arbeitet an Open-Source-GIS-Projekten und Entwicklung von fachspezifischer Open-Source-Software für Forschung und Anwendung und ist seit mehreren Jahren als Mitarbeiter des IT-Referats des Deutschen Archäologischen Instituts schwerpunktmäßig mit dem Bereich Geodaten/Geoinformatik im Rahmen der iDAI.world beschäftigt.

An welchen aktuellen Projekten arbeiten Sie mit?

Ich bin gelernter Archäologe mit den Schwerpunkten Informatik und Geoinformationssysteme (GIS). Seit einigen Jahren bin ich am DAI für den Geodaten-Dienst verantwortlich, der unter https://geoserver.dainst.org zu erreichen ist. Dieser „Geoserver“ ist integraler Bestandteil der iDAI.world, der offenen Online-Infrastruktur des DAI. Er ermöglicht es sowohl Mitarbeitern des DAI als auch externen Projektpartnern und Wissenschaftlern, Daten mit räumlichem Bezug (platt formuliert, alles was Koordinaten hat und sich kartieren lässt) gut dokumentiert (Stichwort: „Metadaten“) abzulegen, kollaborativ zu bearbeiten und schließlich online zu publizieren. Wir setzen dabei vollständig auf freie und quelloffene (Open-Source-) Software. Meine Arbeit beinhaltet auch die Schulung von DAI-Mitarbeitern auf aktuellen Open-Source-GIS.

Was ist die iDAI.world und was beinhaltet sie?

Die iDAI.world ist ein modulares Online-Angebot, das aus einer Reihe von Datenbanken und -diensten besteht, die über das Internet erreichbar sind. Zum Teil (wie im Fall von iDAI.objects, vormals Arachne) handelt es sich dabei um Module mit einer sehr langen Historie, zum Teil (etwa das digitale Ortsregister iDAI.gazetteer und der erwähnte iDAI.geoserver) um neuere Entwicklungen, die den sich stetig ändernden Anforderungen an Forschungsdateninfrastrukturen Rechnung tragen. Dadurch ist eine technisch diversifizierte Plattform entstanden, die sich Benutzern aber einheitlich darstellt und übergreifende Formate, Protokolle und Schnittstellen bietet. Die iDAI.world bietet derzeit u.a. Inhalte zu den Themen „archäologische Objektbeschreibungen“, „digitale Fototheken“, „Geodaten“, „Literatur“ und „Chronologien“. Eine aktuell sehr spannende Entwicklung ist m. E. iDAI.field in Version 2, eine sehr flexible Software zur Datenerfassung im Feld, die auf GitHub zum freihen Download unter Apache 2.0 Lizenz zur Verfügung steht (d. h. Veränderungen am Quelltext, die ursprüngliche Lizenz und das Copyright müssen genannt werden): github.com/dainst/idai-field.

Sie haben an der iDAI.world mitgearbeitet. Welche Bestrebungen hat das DAI im Hinblick auf Open Science und Open Access?

Das DAI verfügt über ungeheure Datenschätze, zu denen u. a. Millionen digitaler Fotos zählen und auch Dokumente, die erst noch digitalisiert werden müssen. Traditionell erfolgte die Publikation dieser Daten (einerseits notgedrungen, andererseits auch aufgrund der spezifischen Nutzungsinteressen) aus heutiger Sicht umständlich, langsam und unvollständig über den Weg der Druckerpresse. Der Blick auf Forschungsdaten hat sich mittlerweile aber gesamtgesellschaftlich fundamental verändert. Man fragt jetzt nicht mehr nur, was „das DAI“, ein Projekt oder eine Wissenschaftlerin daraus machen kann, sondern wie man dieses Potenzial allgemein zugänglich und erschließbar machen kann. In diesem Zusammenhang ist Open Science kein spezifischer Prozess, sondern eher ein Bewusstseins- und Kulturwandel, der u.a. Open Access als eine Form der freien Wissenverbreitung beinhaltet. Dies geht Hand in Hand mit den radikal veränderten Rahmenbedingungen, unter denen Archäologie heutzutage weltweit arbeitet. Wer, wenn nicht das DAI, hat die Möglichkeiten, diesen Wandel global mit zu gestalten und das in dieser Institution über Generationen angereicherte Wissen zum globalen Kulturerbe einer weltweiten Interessentengemeinde zugänglich zu machen? Das konkrete Bestreben des DAI ist in der Konsequenz die Freigabe aller Publikationen und Daten, bei denen dies rechtlich möglich ist, unter einer Open-Access-Lizenz. Dem IT-Referat obliegt dabei in erster Linie die technische Ausführung. Wir haben es uns aber auch zur Aufgabe gemacht, technische Kompetenzen zur Nutzung dieser Daten weltweit zu fördern, und bauen zu diesem Zweck momentan z.B. Online-Plattformen mit Kursmaterial zu Themen wie „Geoinformationssysteme“ und „bildbasierte 3D-Rekonstruktion mit SfM“ auf.

Welche Angebote im Sinne von Open Science bietet die iDAI.world ?

Die iDAI.world bietet ein sehr großes Angebot an offenen Forschungsdaten und -diensten. Ihre Module unterscheiden sich inhaltlich, in ihren Intentionen und technischen Architekturen. Traditionelles Kernstück ist iDAI.objects, mit umfangreichen Bildsammlungen und Beschreibungen zu archäologischen Objekten (Monumenten, Bauteilen, Skulpturen etc.). Seine Datensätze sind eng mit den bibliographischen Einträgen und der Open-Access-Literatur des Moduls iDAI.bibliography (ZENON) verknüpft. Dasselbe gilt für die Einträge im digitalen Ortsregister, dem iDAI.gazetteer. Letzteres geht schon stärker in Richtung Forschungswerkzeug, da es wichtige Funktionen bereitstellt, um riesige Mengen lose strukturierter Forschungsdaten überhaupt erschließbar zu machen. In diese Kerbe schlagen auch iDAI.chronontology, ein Dienst der Datumsangaben mit historischen Perioden und Epochen abgleicht und iDAI.thesauri, das strukturierte Referenzvokabulare für unterschiedliche archäologische Themenfelder enthält. Diese Rollenverteilung trägt der Tatsache Rechnung, dass es bei Open Science nicht nur darum gehen kann, Daten unter einer liberalen Lizenz online zu stellen. Wenn Forschungsdaten effektiv nutzbar sein sollen, müssen sie auch, per standardisierten Metadaten und Schnittstellen, automatisiert verarbeitbar sein. So bietet bspw. der iDAI.geoserver die Möglichkeit, mit einem Geoinformationssystem wie QGIS über eines der Protokolle des Open Geographic Consortium (OGC) direkt auf seine Datenbestände zuzugreifen. Die iDAI.world ist auf Kollaboration ausgelegt und steht in weiten Teilen auch Externen zum Datenaustausch in beide Richtungen offen, d.h. Benutzer können eigene Daten hochladen und auf diese Weise archivieren oder online publizieren.

Welche Lizenzierungsmöglichkeiten gibt es/werden bevorzugt in der iDAI.world und wofür?

Das vom DAI bevorzugte Modell ist „CC BY-SA“, also eine Creative-Commons-Lizenz mit expliziter Pflicht zum Quellenzitat. Letzteres reflektiert einerseits die Wissenschaftskultur, ist aber andererseits auch entscheidend für das tatsächliche Nachnutzungspotenzial der Daten. Denn anonym im Umlauf befindliche Daten, deren Herkunft nicht mehr klar nachgewiesen ist, erleiden erfahrungsgemäß einen Vertrauensverlust und werden nicht weiter in der Forschung verwendet.

Darüber hinaus sind aber alle Module der iDAI.world darauf ausgelegt auch beliebige andere, u.U. striktere, Lizenzbedingungen an einzelne Datensätze zu knüpfen. Das ist einerseits der sehr diversifizierten Herkunft der Daten, andererseits der komplexen rechtlichen Situation geschuldet. Das für uns entscheidende, deutsche Recht kennt kein übertragbares „Copyright“ im angelsächsischen Sinne, sondern trennt zwischen (unveräußerbarem) Urheberrecht und (veräußerbaren) Nutzungsrechten. Was die Neulizenzierung von Daten unter modernen Lizenzen aus dem Bereich der Creative Commons angeht, ist die Situation einigermaßen klar, wenn es um Daten geht, die von Mitarbeitern des DAI erzeugt wurden (zumal zahlreiche Forschungsdaten ohnehin kaum die Schöpfungshöhe erreichen dürften, die vom Urheberrecht verlangt wird). Das DAI kuratiert aber auch umfangreiche Archive und Datenbestände aus den unterschiedlichsten externen Quellen, Partnerprojekten, wissenschaftlichen Nachlässen etc., über deren zukünftige Nutzungsrechte es nicht immer frei entscheiden kann.

Welche Forschungsdaten werden in der iDAI.world langzeitarchiviert?

Der Anspruch der iDAI.world ist es, als offene Infrastruktur für archäologische Forschungsdaten zu dienen und dabei praktisch jede relevante Datenquelle abzudecken. Die vielfältigen Möglichkeiten hatte ich ja eingangs schon erwähnt. Die in der iDAI.world archivierten Daten stammen i.d.R. entweder aus abgeschlossenen Forschungsprojekten oder sie sind das Resultat gezielter „Digitialisierungskampagnen“, wie etwa im Falle der DAI-Fototheken. Regelmäßig stehen wir auch vor der Aufgabe, größere Nachlässe vollständig zu digitalisieren und zu archivieren. Dabei stellen wir immer wieder fest, wie vielfältig die vordigitalen Quellen nicht nur hinsichtlich der Medien, sondern auch in ihren Strukturen und Intentionen sind. Um dem gerecht werden zu können, müssen Konzepte und Technologien der iDAI.world kontinuierlich ausgebaut werden. Überhaupt zwingt uns die große Dynamik der Digitalisierung (hier im Sinne eines fundamentalen, gesellschaftlichen Wandels, nicht als „Scanvorgang“ o.ä. zu verstehen) dazu, auch die Natur und Rolle digitaler Archive immer wieder neu zu denken und dem technisch gerecht zu werden. Ganz konkret gesprochen, stehen wir derzeit z.B. vor der Herausforderung die unstrukturierten 3D-Daten, welche schnell und massenhaft per bildbasierter Rekonstruktion (Stichwort: „Structure from Motion“) produziert werden, angemessen zu berücksichtigen. An diesen Daten zeigt sich schön, dass sich das Werteverhältnis zwischen Ausgangs- und Endprodukten derzeit radikal wandelt. Streng genommen, sind die fertig gerechneten 3D-Modelle nahezu „wertlos“, da sie einerseits jederzeit aus den Rohdaten neu berechnet werden können, andererseits aber auch jedes mal den Grenzen der aktuellen Softwaretechnik unterliegen, was die Qualität der Resultate angeht. Bei solchen „fließenden Produkten“ greift die traditionelle Vorstellung eines Archivs nur noch sehr schlecht. Module wie iDAI.geoserver sind daher bereits darauf ausgelegt, Daten nicht nur in einem Endzustand einmalig zu speichern, sondern „lebendige Archive“ darzustellen, in denen Daten entstehen und kontinuierlich ergänzt und verbessert werden können.

Wie zufrieden sind Sie mit der Nachnutzung der Daten in der iDAI.world bzw. der von Ihnen entwickelten archäologischen Software/Applikationen bzw. welche Nutzungsszenarien würden Sie begrüßen?

Entwicklung und Administration von Software gehören ja bekanntlich zu den undankbareren Aufgaben. Normalerweise bekommt man dann etwas zu hören, wenn sich jemand über einen (vermeintlichen oder echten) Fehler ärgert. So lange alles gut läuft, bekommt man eher selten etwas davon mit. Wir müssen aus meiner Sicht aber auch dennoch besser darin werden, unsere enormen Datenbestände überhaupt durchsuchbar und auffindbar zu machen. Wir arbeiten momentan daran, Metastrukturen und Suchfunktionen bereitzustellen, die es ermöglichen werden, zusammenhängende Daten ganz unterschiedlicher Formate und Speicherorte (z.B. Bilder und geographisch damit zusammenhängende Geodaten) im Kontext zu finden. Immerhin fühlt sich die viele Arbeit im Bereich Open Source und Open Access für mich aber seit einiger Zeit nicht mehr länger wie ein Kampf gegen Windmühlen an.

Die echten Vorteile dieser offenen Ansätze werden in der gesamten Gesellschaft, insbesondere auch in der wissenschaftlichen Gemeinde, sehr stark wahrgenommen. Mehr noch: An der Entwicklung bspw. der DFG-Richtlinien zum Thema Forschungsdaten ist ablesbar, dass es bald keine öffentliche Förderung mehr für Projekte ohne zeitgemäße Open-Access-Politik geben wird (Richtlinien der DFG, siehe auch Stellungnahme DFG zu Open Access auf der Portalseite: Infomaterialien). Das sehe ich naturgemäß mit großer Zufriedenheit. Am zufriedensten aber bin ich persönlich, wenn Software oder Daten in einer Weise genutzt werden, die überhaupt nicht vorgesehen war! Denn genau hierin liegt ja der Vorteil digitaler Information: Ein gedruckter Katalog bspw. kann im Prinzip nur so verwendet werden, wie er einmal vom Autor strukturiert worden ist; jede andere Nutzung würde übermäßigen Aufwand erfordern. Bei Forschungsdaten verhält sich das ganz anders. Würden sie nur so genutzt wie vorgesehen, dann hätte man das meiste Potenzial verschenkt. Im Zusammenhang damit gibt es noch eine andere Nutzungsdimension: Daten und Software sind immer auch Ausdruck von bestimmten Konzepten und Methoden. Manche davon sind so gut und wichtig, dass sie es verdienen auch auf andere Anwendungsfelder übertragen zu werden.

Wir sehen momentan weltweit einen enormen Bedarf beim Aufbau von digitalen Systemen und Datengrundlagen für den Kulturgüterschutz. Für das DAI, welches seine Existenz ja immerhin dem offenen Zugang zu Kulturgütern anderer Nationen verdankt, bietet sich hier die Möglichkeit, eine gestalterische Rolle beim freien Austausch und Transfer erfolgreicher Technologien und Konzepte einzunehmen.

Links zu Projektseiten

Publikationen

Förtsch, R./ Ducke, B. / Ahrens, A./ Meynersen,F., iDAI.welt: The German Archaeological Institute’s Heritage DataInfrastructure and Its Role in Crisis Archaeology, DCH2017 International Conference on Digital Cultural Heritage (Staatsbibliothek Berlin, August 30–September 01, 2017). Online: https://www.academia.edu/34434326/ (letzter Zugriff 02.02.2019)
Francesco Mambrini, The iDAI.publication: extracting and linking information in the publications of the German Archaeological Institute (DAI), in: Elena Cabrio, Alessandro Mazzei,Fabio Tamburini (Hgg.), Proceedings of the Fifth Italian Conference on Computational Linguistics (CLiC-it 2018), Torino, Italy, December 10-11, 2018, CEUR Workshop Proceedings. URN: urn:nbn:de:0074-2253-7. Online: http://ceur-ws.org/Vol-2253/paper10.pdf (letzter Zugriff 02.02.2019)

Kontaktdaten für Fragen zum Projekt

Benjamin Ducke
Deutsches Archäologisches Institut
Zentrale Berlin, IT-Referat
benjamin.ducke@dainst.de

Titelbild: Vom Deutschen Archäologischen Institut unter CC BY-NC

(Interview, Redaktion und Publikation: Esther Schneidenbach)

Lizenzen

  • CC-BY-SA: bevorzugt
  • Andere Lizenzierungen mgl.

Einschränkungen der Lizenzierung

  • Urheberrecht
  • Persönlichkeitsrecht
  • Nutzungsrechteinschränkungen durch externe Vorgaben

Daten

  • Archäologische Daten abgeschlossener Forschungsprojekte
  • Digitalisate: DAI-Fototheken, Nachlässe etc.
  • Metadaten

YouTube Kanal iDAI.worldYouTube-Kanal iDAI.welt

 

Weitere Informationen zu Forschungslizenzen

Bevor Texte, Geodaten, Bilder oder andere Forschungsdaten geteilt werden können, gilt es die Rechte zu klären: Wer sind die Urheber und wer verfügt über die Nutzungsrechte?

Sind die Rechte geklärt, können die Daten zur Kollaboration und Nachnutzung freigegeben werden. Dazu stehen verschiedene Lizenzmodelle zur Verfügung.

Für eine dauerhafte Bereitstellung zur Nachnutzung werden For­schungsdaten mit den gewählten Lizenzen verknüpft und in eine Forschungs­dateninfrastruktur eingebettet.