Lizenzierung bei der Digitalen Akademie Mainz

von Dez. 7, 2016CC BY, Offene Lizenzen

Aline Deicke und Anna Neovesky sind wissenschaftliche Mitarbeiterinnen der Digitalen Akademie der Akademie der Wissenschaften und der Literatur | Mainz. Sie sind Mitglieder des Mainzer Zentrums für Digitalität in den Geistes- und Kulturwissenschaften (mainzed) und lehren im Mainzer Studiengang Digitale Methodik in den Geistes- und Kulturwissenschaften„.

Aline Deicke promoviert an der Johannes Gutenberg-Universität Mainz zum Thema „Identitätsgenese späturnenfelderzeitlicher Eliten im Spiegel funeraler Statusdarstellung“.

Anna Neovesky promoviert an der TU Darmstadt zu Suche und Suchoptimierung in Wissenschaftlichen Sammlungen.

Welche digitale Projekte werden zur Zeit in Ihrer Institution durchgeführt?

An der Akademie werden aktuell rund 40 Projekte aus dem Bereich der geisteswissenschaftlichen Grundlagen- und Langzeitforschung durchgeführt. Als zentrale Forschungseinrichtung für Digital Humanities ist die “Digitale Akademie” der Mainzer Akademie an diesen Vorhaben jeweils mit unterschiedlichen Schwerpunkten beteiligt.

Neben den Projekten des Akademienprogramms werden auch weitere Forschungsvorhaben (bspw. DFG- oder BMBF-geförderte Drittmittelprojekte) mit stark digitalem Einschlag an der Akademie durchgeführt. Das Fächerspektrum der Projekte reicht dabei von der Archäologie und Ägyptologie über die Geschichtswissenschaft, Kunstgeschichte und Onomastik bis hin zur Musikwissenschaft und Philologie.

Kernanliegen der Digitalen Akademie ist es dabei, das ganze Spektrum der Digital Humanities von der Retrodigitalisierung und Kuratierung von Fachdaten über die wissenschaftliche Konzeption und Entwicklung geisteswissenschaftlicher Anwendungen bis hin zur Erschließung informationswissenschaftlich-informatischer Verfahren für die Forschung abzubilden und in die Projekte mit einzubringen.

Welche Projekte halten Sie für besonders interessant?

Für uns sind Forschungsdaten aus dem Bereich der geisteswissenschaftlichen Grundlagenforschung sehr interessant, da die teils umfangreichen Datenmengen von sehr hoher Qualität und inhaltlicher Tiefe sind und viele Anknüpfungspunkte für weiterführende Forschung bieten. Beispiele hierfür sind z. B. die “Regesta Imperii” oder die “Deutschen Inschriften Online”, die auch schon mehrfach im Rahmen von akademischen Qualifikationsschriften oder Drittmittelprojekten nachgenutzt wurden.

Für uns persönlich war vor allem die Arbeit an dem Projekt “Controversia et Confessio” interessant, da wir hier ein Forschungsprojekt aus dem Bereich Netzwerkanalyse andocken konnten, für das sich die Daten hervorragend eignen, und damit eigene Forschungsinteressen vertiefen konnten.

Andere Projekte stehen vielleicht noch am Anfang, aber schon jetzt lässt sich absehen, dass für die Daten ein großes Nutzungsinteresse besteht, z. B. im Projekt “Propyläen. Goethes Biographica”.

Welche Forschungsdaten wurden aus an Ihrer Institution angesiedelten Projekten veröffentlicht und unter welchen Lizenzen?

Zu den veröffentlichten Daten gehören Textdaten verschiedener Formate (bspw. XML, XMP, JSON, RDF, CSV) und Kodierungen (TEI, CEI, EpiDoc, JSON-LD u.a.), Normdaten zu historischen Personen, Lokalitäten und Entitäten sowie hochauflösende Bilddaten, jeweils mit entsprechenden Metadaten angereichert.

Die Daten können teils über REST-Schnittstellen abgerufen werden. Daten, die wir zum Beispiel für eigene Forschungszwecke, Datenanalysen oder Workshops nutzen, stellen wir, genau wie von uns entwickelte Software, auf GitHub bereit (https://github.com/digicademy). Personendaten aus Projekten können teils als BEACON-Dateien nachgenutzt werden (z.B. bei Gutenberg-Biographics, dem Professorenkatalog für die Mainzer Universität)

Sofern keine rechtlichen Gegebenheiten im Wege stehen, werden in allen neu beginnenden Vorhaben der Akademie freie Lizenzmodelle bei der Publikation der Forschungsdaten und -ergebnisse angestrebt. Die Akademie strebt darüber hinaus auch an, die Daten und Ergebnisse aus den bereits laufenden Vorhaben mit freien Lizenzen zu versehen. Die Daten in vielen Vorhaben sind zudem mit stabilen Adressierungen durch z. B. URIs, URNs bzw. Permalinks ausgestattet, um eine dauerhafte Zugänglichkeit und wissenschaftliche Zitierfähigkeit zu gewährleisten.

Generell kommt für die Forschungsdaten häufig CC BY 4.0 zum Einsatz. Für Software setzen wir die GNU GPL und die MIT Lizenz ein. Projekte, in denen bereits unter einer CC BY 4.0-Lizenz publiziert wird, sind z. B. Regesta Imperii (CEI-XML), das Corpus Vitrearum Deutschland (Bilder und zugehörige Metadaten) sowie Controversia et Confessio (Textdaten) oder Gutenberg-Biographics (GND-BEACON, Personendaten).

Nach welchen Kriterien haben Sie sich für die gewählten Lizenzen entschieden?

Die Akademie verfolgt in Abstimmung mit Ihren Projekten generell eine möglichst offene Lizenzierung, bei der die Empfehlungen von Forschungsförderern und Best Practices eine Rolle spielen. Die Lizenzmodelle sollen eine möglichst freie Nach- und Weiternutzung der Forschungsdaten erlauben, gleichzeitig aber auch die geistige Leistung, die in diese Daten eingeflossen ist, würdigen.

Teilweise kam die Lizenzierung auch aus konkreten Anlässen zustande, z. B. bei den Regesta Imperii, die an dem Kulturhackathon Coding da Vinci teilgenommen haben, für den eine offene Lizenzierung der Daten Voraussetzung war.

Wo haben Sie sich bei der Entscheidung über die gewählten Lizenz informiert?

Eine Grundlage sind die Open Access Initiativen der Akademie und der Akademieunion, dazu wie schon angesprochen die Empfehlungen und Open Access-Richtlinien der großen Forschungsförderer wie der DFG und dem BMBF sowie der Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen.

Für uns war außerdem der Leitfaden der UNESCO zu “Open Content Lizenzen” und das Buch “Managing and Sharing Research Data – A Guide to Good Practice” von Louise Corti u.a. sehr hilfreich. Letzteres bietet viele Informationen, die über die Lizenzierung hinausgehend: zu Management, Aufbereitung und Bereitstellung von Forschungsdaten.

Workshops, z. B. von DARIAH-DE, sowie Tagungen zum Thema boten zudem Möglichkeiten zum Austausch und einen Einblick dazu, wie andere Institutionen und Projekte mit dem Thema und der Umsetzung umgehen.

Gibt es Überlegungen, die gewählte Lizenz später noch zu erweitern?

Momentan nicht. In der aktuellen Phase werden Erfahrungen mit den Lizenzmodellen gesammelt, so dass evaluiert werden kann, ob sich der aktuell positive Eindruck auch längerfristig bestätigt. Bei bereits lizenzierten Projekten ist es zudem wichtig, konsistent zu bleiben, damit eine Nutzung der Daten auf einer stabilen Basis steht.

Wie haben sich die gewählten Lizenzen auf die Zusammenarbeit innerhalb des Projekts ausgewirkt?

Zum einen hat der Prozess der Lizenzierung und die Diskussionen in diesem Kontext grundlegende Überlegungen bei allen Beteiligten in Gang gebracht. Heutzutage reicht es nicht mehr, Daten einfach nur online zu stellen, man muss sich auch darüber klar werden, was danach geschieht: wie sie weitergenutzt werden, welche dieser Nutzungen man fördern will, und wie man diese Förderung gestaltet. Lizenzierung ist dabei ein wesentlicher Aspekt, weil sie Rechtssicherheit sowohl für den Anbieter als auch den Nachnutzer gibt.

Zum anderen tritt der Bereich “Nachnutzung”, für den Lizenzierung eine wesentliche Voraussetzung ist, immer stärker in den Vordergrund. Wie schon erwähnt gab es bereits mehrere Beispiele von externen Projekten und auch Abschlussarbeiten, die Forschungsdaten der Akademie nachgenutzt haben, aber auch wir selbst arbeiten auf diesem Material. Außerdem profitieren die Projekte natürlich ganz konkret davon, dass z. B. bei Personendaten ein Austausch von BEACON-Dateien stattfindet. Solche Prozesse führen insgesamt dazu, dass Daten in einer gemeinschaftlichen Anstrengung angereichert und ergänzt werden.

Gab es Probleme oder Fragen zu den Forschungslizenzen, und wie wurden diese geklärt?

Generell gab es eine großes Interesse an der Lizenzierung der Forschungsdaten, um deutlich zu machen unter welchen Bedingungen sie nachgenutzt werden können. Positive Erfahrungen aus anderen Projekten und erste Beispiele für Projekte, die aus Nachnutzung entstehen, haben zudem die Bedeutung von Möglichkeiten von offener Lizenzierung verdeutlicht.

Glücklicherweise hat sich die Mainzer Akademie früh die Rechte zur Onlinepublikation ihrer Werke gesichert, so dass es auf diesem Gebiet selten Probleme gibt. Falls z. B. bei Bildern eine unklare Urheberrechtslage vorliegt, kommt man in der Regel aber zu einer Übereinkunft.

Wie zufrieden sind Sie mit der Nachnutzung der Daten? Welche Nutzungsszenarien würden sie begrüßen?

Viele der Projekte werden bereits nachgenutzt. Genau zu diesem Thema haben wir kürzlich einen Vortrag auf dem Workshop der AG eHumanities der Union der deutschen Akademien der Wissenschaften gehalten, der unter dem Motto “Nachnutzung und Nachnutzbarkeit der Forschung im Akademienprogramm” stand. Der Vortrag ist online unter https://github.com/digicademy/2016-agehum-ddorf und bietet einen guten Überblick auf die verschiedenen Ebenen, auf denen sich Nachnutzung in den Akademieprojekten bewegt.

Ein wesentlicher Aspekt von Grundlagenforschung ist schließlich, dass sie als Basis für weitere Forschungen dienen soll.

Links zu Projektseite und Repositorien

www.digitale-akademie.de

https://github.com/digicademy

https://twitter.com/digicademy

http://www.adwmainz.de

Kontaktdaten für Fragen zum Projekt:

Aline Deicke u. Anna Neovesky

Akademie der Wissenschaften und der Literatur Mainz
Geschwister-Scholl-Str. 2
55131 Mainz
Email: aline.deicke@adwmainz.de, anna.neovesky@adwmainz.de

Titelbild: Bergleute bei der Arbeit.CVMA Deutschland/Freiburg (CC-BY 4.0)

Digitale Akademie der Wissenschaften Mainz

An der Akademie werden aktuell rund 40 Projekte aus dem Bereich der geisteswissenschaftlichen Grundlagen- und Langzeitforschung durchgeführt. Als zentrale Forschungseinrichtung für Digital Humanities ist die “Digitale Akademie” der Mainzer Akademie an diesen Vorhaben jeweils mit unterschiedlichen Schwerpunkten beteiligt.

Projekt-Highlights

Standardformaten

Zu den veröffentlichten Daten gehören Textdaten verschiedener Formate (bspw. XML, XMP, JSON, RDF, CSV) und Kodierungen (TEI, CEI, EpiDoc, JSON-LD u.a.), Normdaten zu historischen Personen, Lokalitäten und Entitäten sowie hochauflösende Bilddaten, jeweils mit entsprechenden Metadaten angereichert.

Lizenzen

Generell kommt für die Forschungsdaten häufig CC BY 4.0 zum Einsatz. Für Software setzen wir die GNU GPL und die MIT Lizenz ein.

Weitere Informationen zu Forschungslizenzen

Bevor Texte, Geodaten, Bilder oder andere Forschungsdaten geteilt werden können, gilt es die Rechte zu klären: Wer sind die Urheber und wer verfügt über die Nutzungsrechte?

Sind die Rechte geklärt, können die Daten zur Kollaboration und Nachnutzung freigegeben werden. Dazu stehen verschiedene Lizenzmodelle zur Verfügung.

Für eine dauerhafte Bereitstellung zur Nachnutzung werden For­schungsdaten mit den gewählten Lizenzen verknüpft und in eine Forschungs­dateninfrastruktur eingebettet.