Metadata

Metadata zijn, eenvoudig gezegd, data over data: het zijn de kenmerken of eigenschappen van een bestand. Zodra je je data gaat publiceren of archiveren zal je gevraagd worden deze gegevens te verschaffen.

Waarom?

Metadata dienen twee doelen:

  • data vindbaar maken: metadata bieden de bouwstenen die de zoekfunctie van een data-archief (repository) nodig heeft om te bepalen of de dataset aan een zoekopdracht voldoet en als zoekresultaat moet worden weergegeven
  • data citeerbaar maken: metadata leveren de elementen voor een correcte verwijzing naar een dataset (citatie)

Wat?

Metadata worden over het algemeen vastgelegd bij het archiveren en/of publiceren van data. Als je een dataset in een data-archief wilt deponeren, zal je gevraagd worden om gegevens over de dataset te verschaffen. Denk daarbij aan zaken als:

  • de maker(s) van de dataset
  • titel of naam van de dataset
  • een korte beschrijving van de dataset
  • de datum waarop de dataset is gemaakt of afgerond
  • de periode waarbinnen de data verzameld zijn of waarop zij betrekking hebben
  • de geografische locatie waar de data verzameld zijn of waarop zij betrekking hebben
  • rechten die op de data rusten (eigendomsrecht, auteursrecht)
  • eventuele toegangsbeperkingen (embargo, voorwaarden)

Er zijn verschillende metadata-standaarden in omloop. De bekendste en meest gebruikte is Dublin Core.

Embedded metadata

Sommige apparatuur en software voegen ook zelf metadata aan een digitaal bestand toe, zg. embedded metadata. Een voorbeeld hiervan zijn de gegevens die een digitale camera in een digitale foto stopt, en de gegevens die in Microsoft Office als eigenschappen van een bestand geregistreerd worden. In Microsoft Office en in software voor kwalitatieve data-analyse kun je ook zelf metadata aan een bestand toevoegen.

Metadata vs documentatie

Metadata toekennen is een dataset zo beschrijven dat de beschrijving door computers gelezen kan worden, bijv. in het kader van een zoekfunctie op de website van een data-archief. Daarnaast gaat een dataset vergezeld van documentatie: informatie die bedoeld is om door mensen gelezen te worden.

Om het onderscheid aan de hand van het voorbeeld van onderzoek door middel van een survey duidelijk te maken:

  • data: de gegeven antwoorden op de vragen
  • metadata: de naam van de maker van de vragenlijst, de datum waarop de vragenlijst is afgenomen etc.
  • documentatie: de vragenlijst, beschrijving van de gehanteerde methode etc.

Meer informatie

Gepubliceerd door  RDM support

23 augustus 2016