In de exacte wetenschappen worden vaak grote hoeveelheden data van uiteenlopende aard geproduceerd: gegevens uit verschillende soorten meetapparatuur, beeldbestanden, databases, simulaties, statistische gegevens, geografische data, spreadsheets, etc. Maar ook data bij publicaties zoals (Open) Office documenten, CSV-bestanden, html, pdf.
Om deze gegevens op de lange termijn vindbaar, toegankelijk en begrijpelijk te houden, is het gewenst de opslag, het delen en archiveren van deze bestanden goed te organiseren en documenteren. Het verantwoord opslaan van en omgaan met onderzoeksgegevens wordt aangeduid als onderzoeksdatamanagement (research data management, RDM).
Een eerste stap bij verantwoord data management is het opstellen van een Data Management Plan (DMP). Hierin beschrijft of beschrijven de onderzoeker(s) welke soorten data verzameld gaan worden, hoe en waar de data worden opgeslagen, en wie er toegang tot de data mag krijgen. Een DMP wordt steeds vaker verplicht gesteld bij het indienen van een subsidieaanvraag voor een onderzoeksvoorstel.
Op de pagina Datamanagementplan kun je vinden welke vragen in een DMP moeten worden beantwoord. Ook zijn er links naar modellen, checklists en online DMP tools die kunnen helpen bij het opstellen van een DMP.
Op de website van de Universiteit van Wageningen zijn een template en voorbeeld Data Management Plans te vinden van PhD onderzoek op het gebied van eco-hydrologische en eco-toxicologie.
Het opstellen van een DMP dient door de onderzoekers zelf te gebeuren, vanuit de bibliotheek kan een informatiespecialist advies en hulp bieden bij het opstellen ervan.
De gegevens die vastgelegd worden bij het produceren van ruwe data worden aangeduid als metadata. Het gaat om informatie die bijvoorbeeld omschrijft wie de data heeft verzameld, waar, wanneer, om welke soort data het gaat, binnen welk onderwerpen ze vallen, etc. Ook bij het deponeren van een dataset in een data-archief zal gevraagd worden om het invullen van meer of minder gegevens die de dataset beschrijven. Een veel gebruikte standaard voor metadata is Dublin Core. Deze standaard biedt een ruime keuze uit velden en is geschikt voor vele soorten data.
Een aantal disciplines hanteert eigen standaarden:
Biologie | Darwin Core |
Ecologie |
Ecological
Metadata Language
(EML) |
Genomics | |
Informatica |
Onder meer |
Algemeen |
Een uitgebreid overzicht voor alle disciplines staat op de website van het Digital Curation Center.
De indiener van een dataset zorgt voor het toevoegen van de metadata. Vanuit de bibliotheek kan een informatiespecialist helpen bij het selecteren van de meest geschikte metadata.
In UvA/HvA figshare kun je je onderzoeksdata veilig én bereikbaar opslaan: je bestanden staan op ISO-gecertificeerde servers in Zwitserland, en jij kunt erbij vanaf elke computer met internetverbinding.
Verder kun je je onderzoeksdata veilig delen, archiveren en publiceren. Elk gepubliceerd item krijgt een Digital Object Identifier (DOI), een unieke permanente link die je kunt vermelden in artikelen en presentaties.
4TU.ResearchData is het samenwerkingsverband van de drie technische universiteiten in Nederland en Wageningen Universiteit. Onderzoekers van de UvA kunnen gebruik maken van 4TU.ResearchData voor de lange termijn archivering van de data.
Dryad is een digitale repository voor het opslaan van data die horen bij wetenschappelijke publicaties. Dryad is ontstaan uit een initiatief van een groep van tijdschriften en wetenschappelijke organisaties op het gebied van de evolutionaire Biologie en Ecologie. De kosten zijn afhankelijk van het tijdschrift waarin het artikel wordt gepubliceerd.
The Arabidopsis Information Resource (TAIR) is bedoeld voor opslag van genetische en moleculair biologische informatie van de model hogere plant Arabidopsis thaliana (Zandraket). De UvA betaalt een jaarlijkse bijdrage ter ondersteuning.
Data-archieven zoals bijv. Ecological Archives (ESA, ecologie), GitHub (software), The University of Florida Sparse Matrix Collection (wis- en natuurkunde) en andere zijn te vinden via registers van data-archieven.
Een groeiend aantal uitgevers van wetenschappelijke tijdschriften stelt als voorwaarde dat de onderzoeksdata die aan een artikel ten grondslag liggen vrij beschikbaar zijn, zowel tijdens het publicatieproces (peer review) als daarna.
Met vragen over onderzoeksdatamanagement binnen de vakgebieden Biologie, Informatica of Logica kun je terecht bij dhr. N.H. (Nesru) Koroso. Hier kun je ook advies krijgen bij het opstellen van een DMP, het selecteren van een geschikte metadatastandaard of repository voor je onderzoeksdata.