Bestandsformaten

Een bestandsformaat is de manier waarop de informatie in een digitaal bestand gecodeerd is. Om onderzoeksdata bruikbaar te houden, is het van belang ze in een duurzaam bestandsformaat op te slaan.

Duurzaamheid

Het bestandsformaat bepaalt met welke software een bestand geopend en bewerkt kan worden. Software kan in onbruik raken. Een bestand dat van die software afhankelijk is, kan daardoor niet meer worden geopend.

Bestandsformaten die op de lange termijn goed bruikbaar blijven, zijn onafhankelijk van specifieke betaalde software, ontwikkelaars of leveranciers (non-proprietary). Het zijn bestandsformaten die open specificaties hebben (open format) of wereldwijd zo veel gebruikt worden dat de kans dat er op termijn geen software meer beschikbaar zal zijn om de bestanden mee te openen, klein is.

Data-archieven, zoals DANS en 4TU.ResearchData, beoordelen bestandsformaten op duurzaamheid. Zij geven aan welke bestandsformaten op de langere termijn de beste garanties bieden voor bruikbaarheid en toegankelijkheid.

Bestandsformaat kiezen

Overwegingen bij het kiezen van een bestandsformaat kunnen zijn:

  • welk bestandsformaat werkt met de software die ik ga gebruiken voor analyse van de data?
  • welk bestandsformaat werkt voor soortgelijke data? Is er een standaard?
  • welk bestandsformaat adviseert mijn (beoogd) data-archief?

Bij software voor data-analyse gaat de voorkeur uit naar software die de mogelijkheid geeft om de data te exporteren en onafhankelijk van de software op te slaan.

Bestandsformaat wijzigen

Een bestand kan vaak worden omgezet in een ander bestandsformaat, bijvoorbeeld een formaat dat minder opslagruimte nodig heeft. Aan zo'n omzetting zijn risico's verbonden:

  • verlies van inhoud (data)
  • verlies van in het bestand opgeslagen kenmerken van het bestand (metadata)
  • verlies van opmaak (bijv. bij tekstbestanden)
  • kwaliteitsverlies (bijv. bij grafische bestanden)

Het is verstandig om, als je een bestand omzet in een ander bestandsformaat, het bestand ook in het originele bestandsformaat te bewaren. Als je ontdekt dat bij het omzetten iets is misgegaan, kun je de schade herstellen met behulp van het originele bestand.

Bestandsformaat achterhalen

De naam van een bestand eindigt doorgaans op een punt met daarachter 3 of 4 letters. Deze bestandsextensie geeft een indicatie van het bestandsformaat, en daarmee van de software waarmee het bestand geopend kan worden.

Gepubliceerd door  RDM support

23 augustus 2016