Sist endret: 22.11.2020

Introduksjon til forskningsdatahåndtering

God forskningsdatahåndtering (engelsk: Research Data Management, RDM) er en forutsetning for at data skal være mulig å forstå og gjenbruke. Også data som ikke skal publiseres åpent må håndteres forsvarlig og med tanke på etterprøvbarhet og transparens.

Hva er forskningsdata?

Alle registeringer, nedtegnelser, kilder eller rapporteringer som samles systematisk i forbindelse med et forskningsprosjekt kan ansees som forskningsdata. Det kan være svar fra spørreskjemaer, intervjuopptak, transkripsjoner, målinger, prøver, bilder, video, observasjoner, modeller, simuleringer eller eksperimenter og statistiske analyser som brukes for å besvare et forskningsspørsmål. Sammenstilling av eksisterende data (kildedata) er også en del av dette. Analyseskript, algoritmer, kode og programvare kan også inkluderes som en type forskningsdata eller forskningsresultater. Om man anser algoritmer, kode og programvare som en annen type forskningsresultater som separat fra data, vil det likevel være mange av de samme prinsippene og vurderingene knyttet til forvaltning, deling og publisering av disse, men med noen andre hensyn og praksis (se også artikkelen om Åpen kildekode). 

Forskningsdatasyklusen

Forskningsdatasyklusen er et nyttig verktøy for å visualisere prosessen med håndtering av forskningsdata. Her fremstilles forskningsprosessen gjennom ulike faser, og denne kan være et hjelpemiddel for å se helhetlig på og planlegge datahåndtering og de ulike stegene som kan inngå i et forskningsprosjekt. Dette kan for eksempel være i forbindelse med utarbeidelse av en datahåndteringsplan, hvor det kan være til hjelp for å se på dataflyt og forhold mellom de ulike fasene av forskningsprosjektet.  

Syklusen begynner gjerne med at man planlegger et nytt prosjekt, tenker over hvordan man kan samle inn nye data (resultatdata) eller søke etter eksisterende data (kildedata) til bruk i prosjektet, og oppretter en datahåndteringsplan ut ifra dette. Deretter kommer den aktive fasen med innsamling, analyse og lagring av data, som kan foregå i flere runder eller faser. Avslutningsfasen innebærer arkivering (langtidslagring) av ferdige datasett, og gjerne åpen publisering av data på samme måte som man publiserer artikler. Når de åpne dataene har blitt publisert vil de så kunne bli kildedata for andre som skal i gang med et prosjekt. 

For bibliotek og andre støttetjenester kan en datahåndteringsplan også brukes for å vurdere og planlegge hvilken infrastruktur og støttetjenester som bør tilbys til forskere (og studenter), for å gi gjennomgående støtte under hele syklusen, og hvordan ulike systemer og verktøy skal samhandle. Denne syklusen er en overordnet, forenklet og idealisert versjon av hvordan forskningsprosessen gjerne foregår, og det vil være stor variasjon i hvordan ulike typer fagfelt og prosjekt gjennomfører datahåndtering. Samtidig er det en del generelle trekk som vil være felles og nødvendig for alle prosjekt (og institusjoner) som ønsker forsvarlig forvaltning av data.

Bilde
Forskningsdatasyklus

Illustrasjonen er hentet fra universitetsbiblioteket ved UC Santa Cruz i California, tilgjengelig under en CC BY-NC-lisens.