Skip to main content
Universiteitsbibliotheek – LibGuides

Onderzoeksdata: Meer weten

Opslaan en delen: dat zijn twee dingen

Er is een verschil tussen data archiveren (veilig opslaan) en data delen. Veilig en duurzaam opslaan gebeurt het liefst in meerdere kopieen op plekken waar ook regelmatig een back-up wordt gemaakt en checks worden gedaan op bit rot. Data delen gebeurt op een plek waar veel onderzoekers bij kunnen en op wat een logische plek is om te zoeken, bijvoorbeeld in een publieke repository. Data delen kan ook door op een opvallende plek (bijvoorbeeld in een publicatie of op een website) te wijzen op een permanente link ('persistent identifier') naar de data.

Onderzoeksdata kan ook beschikbaar worden gesteld onder een embargo; dat wil zeggen dat de data pas na een vastgestelde tijd toegankelijk wordt voor anderen. Onder beschikbaar valt ook opslag op een niet-publieke plek, waar het op aanvraag vandaan kan worden gehaald. Er is op die manier meer zicht op wie de data gebruikt en hoe. De licentie die op de data staat bepaalt vervolgens wie wat met de data mag doen. 

opslaan of delen

Licenties op open onderzoeksdata

Alleen de eigenaar van de data mag deze openbaar maken. Privacy gevoelige data mag in de meeste gevallen niet openbaar. Zoek dus eerst uit wie de rechten bezit, en of openbaarmaken mag.

Om van data Open Data te maken, is een geschikte open data licentie nodig. Een expliciete licentie is noodzakelijk om duidelijkheid en zekerheid te scheppen naar gebruikers toe. Is er geen licentie, dan is de data niet zonder meer te gebruiken.

Creative commons (CC) vervangen binnen copyright 'alle rechten gereserveerd' naar 'sommige rechten gereserveerd'. Er zijn zeven standaard CC licenties. CC-BY is de meest gangbare, hierbij is refereren naar de bron verplicht bij gebruik.

Er zijn echter ook nadelen aan een licentie toekennen aan data. Licenties zijn statisch, en veranderen niet mee met de snelle ontwikkelingen op het gebied van onderzoeksdata. Binnen data repositories is het daarom gebruikelijk om te werken met een CC0 licentie waarbij geen rechten worden gereserveerd. Aanwijzingen met betrekking tot gebruik worden dan aangevuld met gedragscodes, die wel makkelijk aan te passen zijn.

data delen stappen

Beleid van tijdschriften t.a.v. onderzoeksdata

Bruno Parmentier bpmm CCBYNCSAIn het Wikipedia artikel Scientific Data Archiving worden tijdschriften opgesomd die het archiveren van onderzoeksdata stimuleren, waaronder Science, Nature en F1000research. PLOS gaat nog een stap verder, hier is openbaar beschikbaar stellen van data bij een publicatie sinds kort verplicht.

Daarnaast bestaan er data journals die zich nadrukkelijk richten op de opslag van onderzoeksdata. Je beschrijft er alleen je dataset, dus zonder analyses en conclusies. Enkele voorbeelden zijn van de uitgever Ubiquity Press (met data journals zoals: Journal of Open Psychology Data, Journal of Open Archaeology Data, Open Health Data en Journal of Open Research Software); Scientific data (Nature); Geoscience data journal (Wiley),  Earth system science data (Copernicus Publications), en Biodiversity data journal (Pensoft Publishers).

Data journals stellen een aantal zaken verplicht, zoals

  • Onderbrengen van de data in een 'goedgekeurde' repository, of bijvoegen als supplement.
  • De data moet worden voorzien van een persistente identifier, zoals bijvoorbeeld DOI.
  • Aan de data moet een CC-BY, CC0 of equivalente licentie zijn toegekend.

Over het nut van Verrijkte Publicaties

Tutorial Dataverse Network

Beleid van onderzoeksfinanciers

Er is een ware trend gaande ten opzichte van het openbaar maken van onderzoeksdata. Sommige onderzoeksfinanciers hebben hier specifiek beleid over en willen data management ook meefinancieren.

NWONWO ziet verzamelen, bewerken, cureren en deponeren van onderzoeksdata als onderdelen van het reguliere onderzoek. NWO verplicht een dataparagraaf in hun aanvragen. Na toekenning moet dit uitgewerkt worden tot een Data Management Plan. Dit beleid is nog in ontwikkeling.

ZonMwZonMW verplicht een dataparagraaf in hun aanvragen. Na toekenning moet dit uitgewerkt worden tot een Data Management Plan. ZonMW heeft hier checklists voor ontwikkeld.

H2020H2020, het EU programma voor onderzoek en innovatie heeft een data-pilot gestart, waarbij bepaalde onderzoeksgebieden hun data (voor zover mogelijk) verplicht openbaar moeten stellen. Andere onderzoekersgebieden kunnen vrijwillig meedoen aan de pilot.

Jargon in klare taal

Open data = Bij open data wordt er wel naar gestreefd om de beperkingen in hergebruik tot een minimum te beperken. De licentie op deze data is zo min mogelijk beperkend voor het hergebruik. De data voldoen bij voorkeur aan ‘open standaarden’. Open data is bij voorkeur computer-leesbaar, zodat zoekmachines informatie in documenten kunnen vinden.

Data curation = Beheer van datacollecties. Curatie van data zorgt voor een duurzame opslag van de verzamelde onderzoeksgegevens.

Data librarian / datasteward / dataprofessional = Bibliotheekmedewerker die wetenschapper helpt bij ontsluiten en beheren van onderzoeksdata.

Data portal = Een faciliteit die EEN enkele toegang biedt naar datasets van externe organisaties.

Data repository = Een generieke term voor een locatie om data op te slaan. Niet elke data repository heeft een beleid op lange termijn opslag.

Data archive = Een faciliteit welke data voor lange termijn bewaard. Een data archief heeft data van een index voorzien en heeft een zoek functie, zodat data ook teruggevonden kan worden. 

Data seal of approval (DSA) = Een archief met DSA verzekert je dat in de toekomst de data in het archief ook nog verwerkt kan worden in een hoog-kwalitatief en betrouwbare manier.

Metadata = Data over data. Gestandaardiseerde, gestructureerde informatie die het doel, origine, tijdspanne, locatie, condities voor toegang en gebruik aangeeft. Metadata wordt toegevoegd op studie-niveau maar ook op file-niveau.   

Persistent Identifier = Een unieke code die gekoppeld is aan een digitaal object. Met deze code kan het object gevonden worden, zelfs als het object tussendoor wordt verplaatst naar een nieuwe locatie. DOI is een voorbeeld van een persistent identifier.

Linked data =  Dit is een digitale methode voor het publiceren van gestructureerde data. Het steunt op standaard web technologien zoals RDF en HTTP-URIs. Deze laatsten geven concepten een unieke waarde welke door computers geinterpreteerd kan worden. Dat verbind data van verschillende bronnen en maakt de data bevraagbaar.

Voor meer jargon:
Data jargon Research Data Netherlands

Meer informatie over DataverseNL

Bij DataverseNL kun je onderzoeksdata veilig opslaan binnen een onderzoeksgroep of project. Via de bibliotheek kan een Dataverse aangevraagd worden. Dankzij een persistente URI kan iedereen vanuit zijn/haar publicatie verwijzen naar de bijbehorende set onderzoeksdata. Voordelen van DataverseNL ten opzichte van andere repositories zijn:

  • Een Dataverse kan gepersonaliseerd worden met bijvoorbeeld het logo van de groep.
  • Gedeponeerde data binnen de Dataverse kan georganiseerd worden in collecties en subcollecties.
  • Wie kan bijdragen aan de Dataverse en met welke rechten wordt geregeld met het toekennen van rollen.
  • Wie toegang heeft en tot welke data kan ook ingesteld worden. Je kan delen met een collega, onderzoeksgroep of zelfs de hele wereld.

Meer informatie vind je op DataverseNL: Opslaan en delen van onderzoeksdata