Einleitung

Konzepte fur das Forschungsdatenmanagement an der Universitat Rostock { Extended Abstract

Ilvio Bruder

Andreas Heuer

Sebastian Schick und Sascha Spors

Universitat Rostock

2017

Research Data Management aims at gathering, capturing, storing, tracking, and archiving all the data being produced in scienti c projects and experiments. Besides these data, all the processing steps on these data - eventually resulting in scienti c publications - have to be stored as well. Research Data Management is not only a scienti c discipline in Computer Science. Universities and Research Institutes have to provide organizational structures and processes and pragmatic solutions (hardware and software resources) to implement rst, simple tasks of Research Data Management. In this paper, we sketch the organizational, pragmatic, and research aspects of Research Data Management from a local (University of Rostock) point of view. At the University of Rostock, we have wider experiences with research data management in marine biology and medical research. The research aspects are part of modern database research topics such as temporal databases, data integration, schema evolution, and provenance management. Ziel des Forschungsdatenmanagement ist es, Daten, die bei wissenschaftlichen Projekten, Experimenten oder Beobachtungen erfasst werden, zu verfolgen und zu archivieren. Zusatzlich muss die weitere Verarbeitung der Daten bis hin zur Publikation gespeichert und nachvollziehbar gemacht werden. Viele Konferenzen und Workshops widmen sich unter anderem genau diesem Thema und Forschungsgeldgeber erwarten bei Ausschreibungen fast immer Konzepte bzgl. Nachhaltigkeit, Nachvollziehbarkeit und O enlegung von Forschungsdaten. Daher mussen an Universitaten verstarkt organisatorische Konzepte fur das Forschungsdatenmanagement entwickelt werden sowie zeitnah pragmatische Losungen fur eine erste Umsetzung des Forschungsdatenmanagements implementiert werden. In diesem Beitrag soll ein U berblick uber die organisatorischen Ma nahmen und die pragmatischen Losungen an der Universitat Rostock gegeben werden. Daruberhinaus ist Forschungsdatenmanagement ein aktuelles Forschungsthema, bei dem insbesondere moderne Datenbanktechnologien benotigt werden. In diesem Beitrag werden wir einige Forschungsansatze skizzieren, mit denen wir

Einleitung

uns speziell in der Datenbankforschungsgruppe der Universitat Rostock befassen. Insbesondere werden Forschungsergebnisse aus den Bereichen temporale Datenbanken, Datenintegration, Schemaevolution sowie Provenance-Management erwahnt.

An der Universitat Rostock haben wir speziell Erfahrungen im Bereich von Informatik- [ 8 ] und Elektrotechnik-Forschungsgebieten [18] und im Bereich meeresbiologischer Forschungsdaten [ 2 ], mittlerweile aber auch verstarkt in anderen naturwissenschaftlichen und medizinischen [19] Forschungsbereichen. Ein ganz anderer Bereich sind die weniger (mess- und sensor-)datengetriebenen geisteswissenschaftlichen Forschungsgebiete (Digital Humanities), in denen sehr dokumentzentriert gearbeitet wird [ 15 ]. Im Folgenden werden wir uns eher mit den datengetriebenen Szenarien befassen. 2

Herausforderungen des Forschungsdatenmanagements

Es gibt im Forschungsdatenmanagement eine Reihe von Herausforderungen, die zum einen eher organisatorisch bzw. praktisch orientiert sind. Zum anderen gibt es auch interessante Herausforderungen in der Grundlagenforschung, gerade in Bezug auf Datenbanktechnologien. Die Herausforderungen in der DatenbankGrundlagenforschung sind { die Heterogenitat der Daten, { ein nicht oder nur unvollstandig vorhandenes Schema, { die Sicherung der Provenance (Herkunft) der Forschungsergebnisse sowie die

Reproduzierbarkeit der wissenschaftlichen Auswertungen, { die Spezi kation und Nachverfolgung von wissenschaftlichen Arbeitsablaufen (Scienti c Work ows), sowohl organisatorisch als auch datentechnisch, { die Einbettung und Speicherung von anwendungsspezi schen Funktionen und Methoden, insbesondere zur Analyse von Daten, { temporale Aspekte zur Reproduzierbarkeit von Auswertungen uber Messdaten, die als Stromdaten standig produziert werden { sowie die Komplexitat in den Auswertungen und Veranderungen in den Auswertungsroutinen uber einen langeren Zeitraum hinweg.

Eher praktische Herausforderungen, die zeitnah mit pragmatischen und bereits vorhandenen Hardware- und Software-Losungen implementiert werden mussen, sind { Open Science, inklusive Zugri auf und Prasentation von Daten und Ergebnissen, { die Umsetzbarkeit von Losungen in der Praxis, etwa durch exible Architekturen, { die Nachhaltigkeit der implementierten Losungen, { Usability bzw. Ergonomie des Softwaresystems { sowie Lizenz- und Rechtsfragen bei benutzten Originaldaten und Softwarewerkzeugen zur Auswertung und Darstellung der Daten.

Andere Ansatze unterstutzen auch kollaboratives Arbeiten und stellen die Erfassung, Verwaltung und Nutzung von Forschungs-Metadaten in den Vordergrund (wie LabBook: [ 11 ]). Weiterhin konnen Forschungsdaten und (datenbankgestutzte) Auswerungen auch in das zu publizierende Dokument integriert werden wie in Janiform mit den Portable DataBase Files (PDbF) [ 5 ].

Einige der oben genannten Herausforderungen werden wir im Folgenden genauer diskutieren. 3

Forschungsdaten-Lifecycle

In Forschungseinrichtungen wird man mit einer Vielzahl an Experimenten und Auswertungen aus sehr unterschiedlichen, interdisziplinaren Forschungsbereichen konfrontiert. Die Daten, Methodik und verwendeten Werkzeuge sind sehr heterogen. Fur die Zusammenarbeit mussen Austauschbarkeit und Interoperabilitat gewahrleistet werden. Hierzu gibt es verschiedene Modellierungsansatze, die entweder abstrakt und damit allgemeingultiger oder eher spezialisiert und damit komplexer sind. Des Weiteren gibt es unterschiedliche Daten und Ziele der Verarbeitung entlang des Lifecycles eines Experiments. Abbildung 1 veranschaulicht einen solchen Lifecycle von der ersten Erfassung der Daten als Primarforschungsdaten uber die weitere Verarbeitung bis hin zur Publikation. Dabei ist fur die Nachvollziehbarkeit der Forschungsergebnisse die gesamte Kette der Datenverarbeitung von der Erfassung bis zur Publikation aufzunehmen und zu archivieren (gruner Rahmen).

Abb. 1. Lifecycle von Forschungsdaten aus [ 2 ]

Forschungsdaten- und Publikations-Work ows sind in der Wissenschaft eng verzahnt. Dabei gibt es viele mogliche Ablaufe, die beliebige Zusammenhange zwischen Experimenten, Primarforschungsdaten, Sekundarforschungsdaten sowie Publikationen abbilden. Hier haben sich Scienti c-Work ow-Systeme wie z.B. Kepler [ 13 ] etabliert. Publikationsprozesse sind Bestandteil des Gebiets der Digitalen Bibliotheken (siehe z.B. [21]).

Grundlegendes Prinzip, das im Rahmen dieser wissenschaftlichen Arbeitsablaufe realisiert werden muss, ist das FAIR-Prinzip aus [20]. FAIR beinhaltet, dass Daten au ndbar ( ndable), zugreifbar (accessible), interoperabel und wiederverwendbar (reusable) sein mussen. Wir werden nun zunachst einige organisatorische Ma nahmen sowie pragmatische Losungen beschreiben, die dieses Prinzip fordern sollen. 4

Forschungsdatenmanagement an der Universitat Rostock

An der Universitat Rostock wurden und werden verschiedene organisatorische Konzepte sowie grundlegende als auch praxisnahe Losungen entwickelt. Einige sollen im Folgenden kurz vorgestellt werden.

Rostocker Modell

Das "Rostocker Modell\ der Universitat Rostock [ 9 ] regelt die Zustandigkeit und generelle Verfahrensweise bei der Verstetigung und Nachhaltigkeit von Spezialarchiven, die im Rahmen von Forschungsprojekten an verschiedenen Fakultaten der Universitat Rostock entstehen oder entstanden sind.

Derartige Spezialarchive zeichnen sich dadurch aus, dass sie nicht nur die Daten selbst speichern, sondern auch (Text-, Bild-, Multimedia-)Dokumente sowie archiv-spezi sche Funktionen und Methoden. Solche Funktionen und Methoden gehen uber das hinaus, was Standard-Software und Standard-DBMS bieten. Das bedeutet, dass man solche Archive nicht einfach durch herkommliche Software-Maintenance warten kann, sondern auch die spezielle Funktionalitat aktuell halten muss. Die Rostocker Losung ist eine Arbeitsteilung zwischen dem Universitatsrechenzentrum (ITMZ: IT- und Medienzentrum), der Universitatsbibliothek (UB) sowie dem Institut fur Informatik, die in zugrundeliegenden Projekten oftmals beteiligt sind. Daruberhinaus wird mit regionalen Softwarermen die Wartung unterstutzt. Hierdurch ist es moglich, auch langere Zeit nach Beendigung des Projektes eine zumindest grundlegende Funktionalitat des Spezialarchivs eines abgeschlossenen Software-Projektes innerhalb und au erhalb der Universitat Rostock verfugbar zu halten.

Beispielsweise wurden in einer aktuellen Arbeit in 2017 Forschungsergebnisse des Projekts eNoteHistory [ 1 ] auf einen aktuellen Softwarestand gebracht. Dieses Projekt war bereits vor 10 Jahren abgeschlossen worden. Im Projekt wurden Notenhandschriften digitalisiert, gespeichert und so aufbereitet, dass ein Au nden nach Merkmalen des Schreibers der Noten moglich war. Die Software musste dabei von einer IBM-DB2-Losung (in 2004 noch mit den damals vorhandenen Text und Image Extendern entwickelt) auf eine aktuelle PostgreSQL-Version umgestellt werden. Dabei wurden auch viele Erfahrungen gesammelt, was in der Zukunft bei analogen Projekten konzeptionell zu uberdenken ist, wenn keine kontinuierliche Evolution der Soft- und Hardware nach Projektende moglich ist.

Forschungsdatenwork ow und Publikationswork ow an der Universitat Rostock

Die Universitat Rostock unterstutzt aktiv Open-Access-Vero entlichungen und hat u.a. die \Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities" [ 12 ] unterzeichnet. Au erdem wurde ein Publikationsfonds fur Open-Access-Vero entlichungen unter Beteiligung der Universitatsbibliothek und Vertretern aller Fakultaten aufgebaut. Weiterhin be nden sich an der Universitatsbibliothek Dienste im Bereich des Forschungsdatenmanagements im Aufbau. Dazu zahlen Services zur Strategie und Wahl des Datenmanagements und der Datenstandards, zur Reprasentation des Wissens sowie bei der digitalen Archivierung von Daten.

Fur die Publikationen, deren Langzeitarchivierung sowie deren stabilen Zitierbarkeit wird an der Universitat Rostock auf entsprechende Systeme, die die eindeutige Referenzierbarkeit per Digital Object Identi ers (DOI) realisieren, zuruckgegri en. Basis ist das System \RosDok" (http://rosdok.uni-rostock.de), das Dokumente in einer Digitalen Bibliothek organisiert, speichert und zugreifbar halt. Erweitert wird das System, um neben den Publikationen selbst auch Daten und Referenzen fur die Forschungsdaten und -methoden anzubieten. RosDok basiert auf dem MyCoRe-System [17]. Die Universitat Rostock plant das Forschungsdatenmanagement zentral zu koordinieren und die vorhandenen Dienstleistungen kontinuierlich zu erweitern.

Open Science und pragmatische Losungen fur die kurzfristige Umsetzung des Forschungsdatenmanagements

Open Science ist eine Forderung an die Wissenschaft aus dem gesellschaftlichen Kontext heraus: wissenschaftliche Ergebnisse, von o entlich-rechtlichen Einrichtungen erzielt oder aus o entlichen Mitteln nanziert, sollten auch der O entlichkeit zur Verfugung stehen. Open Science wird daher gerade von staatlichen Forschungsforderern als Voraussetzung fur gute wissenschaftliche Praxis angesehen.

Zur Open Science gehoren eine Reihe von Begri ichkeiten und Konzepten, um die Wissenschaft transparent und nachvollziehbar fur jedermann anzubieten (siehe auch [18]): { Open Source { freie Verfugbarkeit des Sourcecodes und der im Forschungsprojekt verwendeten Werkzeuge { Open (Science) Data { freie Verfugbarkeit der wissenschaftlichen Daten. Dazu gehoren auch Protokolle, Beschreibungen, Kalibrierdaten, etc. { Open Access { freier Zugri auf die vero entlichten Ergebnisse, wie Forschungsartikel { Open Methodology { Beschreibung aller verwendeten Methoden, die fur das

Forschungsergebnis genutzt und entwickelt wurden { Open Notebook Science { freie Verfugbarkeit samtlicher Basisdaten, Aufzeichnungen, Planungs- und Einsatzinformationen zu einem Forschungsprojekt { Open Educational Resources { freier Zugang zu Lehr- und Lernmaterialien bzgl. der Forschung { Open Peer Review { Transparenz und o entlicher Zugang zum ReviewingProzess im wissenschaftlichen Publikations- bzw. Antragsprozess Fur die Realisierung von Open (Science) Data werden in einigen Forschungsgruppen der Universitat Rostock derzeit zunachst fur das interne Management der Daten Versionskontrollwerkzeuge wie SVN and Git benutzt. Vero entlicht werden die Daten dann uber GitHub. Nachteilig bei diesen Werkzeugen ist insbesondere die Versionsverfolgung bei einer sehr gro en Anzahl von Forschungsdaten (und -dateien). Ein positiver Seitene ekt bei der o entlichen Bereitstellung ist dagegen die Notwendigkeit fur eine saubere Dokumentation (die sonst oft unterbleibt), eine Bereinigung von Daten und Ergebnissen, und eine ausfuhrliche gruppeninterne Diskussion uber Originaldaten und Ergebnisse.

Gerade die angesprochenen Probleme bei der Versionsverfolgung bei Forschungsergebnissen, die uber einen langeren Zeitraum, etwa auch permanent, gewonnen und ausgewertet werden fuhrten zu einigen grundlegenden Forschungsarbeiten, die derzeit in der Datenbank-Forschungsgruppe der Universitat Rostock vorangetrieben werden. 5

Forschungsfragestellungen im Forschungsdatenmanagement

Im Folgenden wollen wir einige Fragestellungen des Forschungsdatenmanagements mit Bezug zu Datenbanktechniken genauer vorstellen. Im Gegensatz zu [ 2 ] werden wir uns in diesem Artikel nicht nur auf die meeresbiologischen Szenarien eines unserer Aninstitute konzentrieren, sondern auch andere datengetriebene Szenarien und die dort auftretenden Fragestellungen berucksichtigen. Andererseits werden wir uns im Gegensatz zu [ 2 ] eher auf die Teilbereiche des Provenance Management und die Reproduzierbarkeit von Forschungsergebnissen konzentrieren und die gesamte Integrationspipeline nur uberblicksartig vorstellen.

In der Systematik von Abbildung 1 werden wir uns dabei um die Auswertung von Primar- und Sekundarforschungsdaten in langfristigen Messreihen kummern. Dabei ist die Reproduzierbarkeit dieser Auswertungsergebnisse fur die Nachprufbarkeit von Publikationsergebnissen in naturwissenschaftlicher Forschung wichtig. Das Provenance Management wird aber auch benotigt, um bei der Erforschung und Entwicklung von smarten Systemen (Assistenzsystemen) beurteilen zu konnen, warum die Situations- und Aktivitatserkennung in Assistenzsystemen in bestimmten Fallen fehlerhafte Ergebnisse geliefert hat. Sowohl bei langfristigen Messreihen als auch bei der Entwicklung von smarten Systemen sind daneben auch noch temporale Aspekte wichtig, da uber die Zeit sowohl erfasste Daten als auch Auswertungsmethoden sich verandern konnen.

Provenance Management und Reproduzierbarkeit von Forschungsergebnissen

Bei der Reproduzierbarkeit von Forschungsergebnissen gibt es verschiedene Stufen. Man kann testen { ob ein Ergebnis plausibel ist: hier ist die Fragestellung, ob eine Aussage in einer Publikation zu den gespeicherten Forschungsdaten passt; ublicherweise eine manuell durch Gutachter durchzufuhrende Tatigkeit, die u.a. durch Textanalysen softwaretechnisch zumindest unterstutzt werden kann { ob das Ergebnis nachvollziehbar ist: hier ist die Fragestellung, ob ein etwa tabellarisch aufbereitetes Ergebnis aus strukturierten Daten zu den gespeicherten Forschungsdaten passt; hier greifen schon weitere Analyseverfahren, die auf strukturierte Daten angewendet werden konnen { oder ob das Ergebnis reproduzierbar ist: hier muss dasselbe Ergebnis aus strukturierten Daten auf Basis der gespeicherten Primarforschungsdaten mit der gleichen Methodik (etwa einer gespeicherten Analysefunktion) softwaretechnisch ohne Medienbruch wieder errechnet werden konnen.

Wenn man davon ausgeht, dass die Forschungsarbeiten auf Basis von Open Science durchgefuhrt werden, sollten die Forschungsergebnisse prinzipiell immer von den Primarforschungsdaten her reproduzierbar sein. Der entgegengesetzte Weg, vom Ergebnis zuruck zu den Primarforschungsdaten, ist die Ruckverfolgbarkeit von Forschungsergebnissen. Das zugrundeliegende Forschungsgebiet im Datenbankbereich ist das Provenance Management.

In der Provenance-Theorie unterscheidet man Where-, Why- und HowProvenance [ 16,4 ]. Die Fragestellungen dahinter sind: { Where { woher kommen die Daten, die zu dem Ergebnis fuhrten? Ergebnis ist die Herkunft der Daten in Form von zugrundliegenden Datenbanken, Dateiverzeichnissen, Datensammlungen oder Repositorien. { Why { welche Daten spielten exakt eine Rolle? Ergebnis sind die Einzeldaten (relational: die Tupel in Relationen), die in die Methodik einge ossen sind. { How { wie ist es mit diesen Daten zu diesem Ergebnis gekommen? Ergebnis ist eine Darstellung der angewendeten Operationen inklusive der Reihenfolge der Bearbeitungsschritte, die fur die Ermittlung des Ergebnisses relevant waren.

Dabei sind Where- und Why-Anfragen auf die Forschungsdaten mit aktuellen Mitteln, wie z.B. einer Datenbankerweiterung der Open-Source-Datenbank PostgreSQL [ 7 ], machbar. Leider eignen sich die derzeit vorhandenen ProvenanceTechniken nur unter sehr speziellen Randbedingungen, die ublicherweise bei Forschungsprojekten mit komplexen Auswertungsfunktionen nicht gegeben sind: { Die Auswertungen auf den Daten werden nur mit Selektion, Projektion und Verbund vorgenommen. Nur in speziellen Fallen konnen Aggregatfunktionen berucksichtigt werden. Analysen auf Forschungsdaten enthalten aber ublicherweise komplexe statistische Funktionen oder gar Machine-LearningAlgorithmen. { Die Auswertungen auf den Daten werden auf einer xierten Datenbank vorgenommen: die Forschungsergebnisse berucksichtigen keine Updates (bei Stromdaten: standig sich andernde Menge an Primarforschungsdaten) auf den Forschungsdaten. Hier mussen wir die Provenance-Techniken mit temporalen Aspekten (siehe unten) verknupfen.

Ein grundlegendes Forschungsproblem ist dabei, welcher (minimale) Ausschnitt von den Primarforschungsdaten in welcher Version (unveranderbar) gespeichert werden muss (wir nennen es: eingefroren werden muss), so dass man aus den Ergebnissen der Auswertung und den eingefrorenen Daten die Inverse der Auswertung (Anfrage an die Datenbank) automatisiert berechnen kann. Fur unsere Forschungsarbeiten hierzu erweitern wir den Begri der inversen Schemaabbildungen, der fur Datenaustausch und Datenintegration etwa in [ 6 ] eingefuhrt wurde.

Ziele unserer Forschungsarbeiten zum Provenance Management haben wir in [ 8 ] bereits im Kontext der Entwicklung von Assistenzsystemen vorgestellt. Die zu entwickelnden Verfahren des Provenance Management werden nun aber auch auf die Ruckverfolgbarkeit von Forschungsergebnissen im Rahmen des Forschungsdatenmanagements angewandt [ 2 ] und weiterentwickelt.

Temporale Aspekte im Forschungsdatenmanagement

Fur den Umgang mit Forschungsdaten sind Auswertungen von historischen Daten als auch die spatere Nachvollziehbarkeit von Forschungsergebnissen ein wesentliches Qualitatsmerkmal fur eine Nachhaltigkeit dieser Forschung. Temporale Informationen uber die Daten und Experimente sind notig, um eine solche Nachhaltigkeit zu erreichen.

Das Speichern temporaler Informationen zu den Forschungsdaten sind z.B. fur Provenance-Anfragen, historische Vergleiche bzw. fur sogenannte TimeTravel-Anfragen essentiell. Time-Travel-Anfragen sind Anfragen auf Datenbestande, die auch zu anderen Zeitpunkten als dem aktuellen gultig waren. Seit dem SQL:2011-Standard [ 10 ] sind temporale Aspekte fester Bestandteil des Datenbankstandards. Unser Prototyp zum Forschungsdatenmanagement, der im Rahmen einer Koopperation mit einem Aninstitut der Universitat Rostock entwickelt wurde, wurde auf Basis von PostgreSQL implementiert, da dieses System verglichen mit anderen Open-Source-DBMS mehr Voraussetzungen fur die Umsetzung von SQL:2011-Konzepten angeboten hat [ 14 ].

Da sich neben den Daten auch Funktionen uber die Zeit verandern konnen, mussen auch diese versioniert und mit entsprechenden Zeitintervallen beschrieben werden konnen. Eine Versionierung von User De ned Functions (UDFs in RDBMS) ist im SQL-Standard noch nicht vorgesehen, so dass gleiche Funktionen (gleiche Namen und Parameter) mit unterschiedlicher zeitlicher Gultigkeit nicht gleichzeitig in der Datenbank registriert sein konnen. Hierzu bedarf es zur Zeit noch manuell de nierter Tabellen zur Verwaltung der zeitlichen Gultigkeit von Funktionen bzw. zusatzliche Werkzeuge zur An- und Abmeldung von UDFs, die gerade fur eine spezielle Anfrage benotigt werden.

Integration statt Migration { Integrationspipeline

Bei der Organisation des Forschungsdatenmanagements werden meist Richtlinien (gibt es bei der DFG, BMBF, Hochschulen und Forschungseinrichtungen) oder Handbucher (ein allgemeines auch von der DFG anerkanntes ist [ 3 ]) ausgearbeitet, die die Vorgehensweise vorgeben. Aus bisherigen Erfahrungen wird allerdings eine solche Vorgabe nicht unbedingt beachtet und die Durchsetzung gestaltet sich ebenfalls oftmals schwierig. Kernpunkt eines nutzerfreundlichen Forschungsdatenmanagements sollte sein { den Wissenschaftlern einen Mehrwert mit der Forschungsdatenverwaltung zu bieten, { ihre Vorgehensweisen und Werkzeuge nicht zu ersetzen, sondern zu integrieren, sowie { Services anzubieten, neben Beratung auch direkte, technische Unterstutzung bei der Organisation und Umsetzung einer konkreten individuellen als auch verknupften Forschungsdatenverwaltung.

Wissenschaftler stellen sich nicht zwangsweise komplett auf eine andere Art der Datenverwaltung um. Es ist bzgl. der Compliance besser, die speziellen Vorgange der einzelnen Wissenschaftler in eine Gesamtstrategie zum Forschungsdatenmanagement zu integrieren.

Um die Forschungsdaten aus verschiedenen wissenschaftlichen Projekten zu integrieren sind Transformations- und Evolutionsprozesse der Daten, der Schemata und der Funktionalitat vonnoten. Diese Vorgange ahneln dem ETL-Prozess in Data Warehouses. Wir haben dazu eine Integrationspipeline entwickelt, die uber verschiedene Stufen halbautomatisch Schemata extrahieren und integrieren kann [ 2 ]. 6

Zusammenfassung

In diesem Beitrag wurden drei Aspekte des Forschungsdatenmanagements diskutiert. Es wurden die derzeitigen und geplanten organisatorischen Rahmenbedingungen an der Universitat Rostock vorgestellt. Es wurden zunachst pragmatische Losungen aufgezeigt, um zeitnah Losungen fur die Open-Science-Anforderungen umsetzen zu konnen. Schlie lich wurden Forschungsherausforderungen insbesondere aus dem Bereich der Datenbanktechnologie prasentiert.

Die Autorengruppe arbeitet dabei an verschiedenen Teilaspekten, etwa an den organisatorischen Rahmenbedingungen (Schick; Universitatsbibliothek Rostock, verantwortlich fur Digitale Bibliotheken und Forschungsdaten), den pragmatischen Losungen fur die Open Science im Kontext eines startenden Sonderforschungsbereiches (Spors; Institut fur Nachrichtentechnik) und an den genannten Forschungsfragestellungen (Bruder, Heuer; Institut fur Informatik, Forschungsgruppe Datenbanken). 17. Wiebke Oeltjen. Virtuelle Bibliotheken exibel gestalten. In eLibrary { den Wandel gestalten, Proceedings of the WissKom'10, pages 259{266. Schriften des Forschungszentrums Julich, 2010. 18. Sascha Spors, Matthias Geier, and Hagen Wierstorf. Towards Open Science in Acoustics: Foundations and Best Practices. In Tagungsband der DAGA'17, pages 218{221. DEGA, 2017. 19. Georgi Straube, Ilvio Bruder, Dortje Loper, and Andreas Heuer. Data Integration in a Clinical Environment Using the Global-as-Local-View-Extension Technique. In Yanchun Zhang, Guiqing Yao, Jing He, Lei Wang, Neil R. Smalheiser, and XiaoXia Yin, editors, Health Information Science - Third International Conference, HIS 2014, Shenzhen, China, April 22-23, 2014. Proceedings, volume 8423 of Lecture Notes in Computer Science, pages 148{159. Springer, 2014. 20. Mark D. Wilkinson and et.al. The FAIR Guiding Principles for scienti c data management and stewardship. Scienti c Data, 3, 2016. 21. Ian Witten, David Bainbridge, and David Nichols. How to Build a Digital Library.

Morgan Kaufmann, 2nd edition, 2010.

Ilvio

Bruder , Temenushka Ignatova, and

Lars

Milewski . Knowledge-Based Scribe Recognition in Historical Music Archives . In Rachel Heery and Liz Lyon, editors, Research and Advanced Technology for Digital Libraries, 8th European Conference, ECDL'04 , volume 3232 of Lecture Notes in Computer Science, pages 304 { 316 . Springer, 2004 .

Ilvio

Bruder , Meike Klettke, Mark Lukas Moller, Frank Meyer, Andreas Heuer, Susanne Jurgensmann, and Susanne Feistel. Daten wie Sand am Meer - Datenerhebung , -strukturierung, -management und Data Provenance fur die Ostseeforschung . Datenbank-Spektrum , 17 ( 2 ): 183 { 196 , 2017 .

3. Stephan Buttner, Hans-Christoph Hobohm , and Lars Muller. Handbuch Forschungsdatenmanagement. BOCK+HERCHEN , 2011 .

James

Cheney , Laura Chiticariu, and Wang Chiew Tan . Provenance in databases: Why, how, and where . Foundations and Trends in Databases , 1 ( 4 ): 379 { 474 , 2009 .

Jens

Dittrich and

Patrick

Bender . Janiform intra-document analytics for reproducible research . PVLDB, 8 ( 12 ): 1972 { 1975 , 2015 .

Ronald

Fagin , Phokion G. Kolaitis, Lucian Popa, and Wang Chiew Tan . Schema mapping evolution through composition and inversion . In Zohra Bellahsene, Angela Bonifati, and Erhard Rahm, editors, Schema Matching and Mapping, Data-Centric Systems and Applications , pages 191 { 222 . Springer, 2011 .

Boris

Glavic and

Gustavo

Alonso . The PERM provenance management system in action . In Proc. SIGMOD'09 , 2009 .

Andreas

Heuer . METIS in PArADISE: Provenance Management bei der Auswertung von Sensordatenmengen fur die Entwicklung von Assistenzsystemen . In Norbert Ritter, Andreas Henrich, Wolfgang Lehner, Andreas Thor, Ste en Friedrich, and Wolfram Wingerath, editors, Datenbanksysteme fur Business , Technologie und Web (BTW 2015 ) - Workshopband, 2 .- 3 . Marz 2015 , Hamburg, Germany, volume 242 of LNI , pages 131 { 136 . GI , 2015 .

Andreas

Heuer , Holger Meyer, and Ilvio Bruder. Nachhaltigkeit von digitalen Dokumenten { das Rostocker Modell . Steinbeis Transfermagazin , 04 / 2014 , 2014 .

10. ISO/IEC 9075-2: 2011 . Information technology - Database languages - SQL-Part 2: Foundation (SQL/Foundation) . Technical report, ISO/IEC JTC 1/SC 32 , 2011 .

11. Eser

Kandogan

, Mary Roth, Peter M. Schwarz , Joshua Hui, Ignacio G. Terrizzano, Christina Christodoulakis, and Renee J. Miller . Labbook: Metadata-driven social collaborative data analysis . In Proc. International Conference on Big Data , pages 431 { 440 . IEEE, 2015 .

12. Max-Planck-Gesellschaft . Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities , 2003 . erreichbar unter https://openaccess.mpg.de/.

13. Timothy

McPhilips

Shawn

Bowers , and Bertram Ludascher. Collection-oriented scienti c work ows for integrating and analyzing biological data . In Proceedings of the DILS Workshop , 2006 .

14. Frank Meyer. Temporale Aspekte und Provenance-Anfragen im Umfeld des Forschungsdatenmanagements . Master-Arbeit, Universitat Rostock , 2016 .

15. Holger Meyer, Alf-Christian Schering , and Andreas Heuer . The Hydra.PowerGraph System - Building Digital Archives with Directed and Typed Hypergraphs . Datenbank-Spektrum, 17 ( 2 ): 113 { 129 , 2017 .

16.

Luc

Moreau and

Paul T.

Groth . Provenance: An Introduction to PROV . Morgan & Claypool, 2013 .