Sist endret: 22.11.2020

Innsamling og lagring av forskningsdata

Prosessen fra innsamling av data og fram til datasettet arkiveres, utgjør den aktive delen av forskningsdatahåndteringen. Flytting og mellomlagring er punkter som ofte glemmes og som kan gjøre data sårbare, og det er viktig at forskere har god oversikt over dataflyten gjennom hele forskningsprosessen.
Bilde
Lagringsløsning

Innsamling av data

Ved innsamling av data gjelder de samme hensynene som for resten av den aktive datahåndteringen. Data må sikres mot tap og ødeleggelse, og dersom det er snakk om personopplysninger eller andre former for sensitive og konfidensielle data, må de også skjermes mot innsyn under innsamling og overføring til lagringsområdet. Her er det viktig å tenke helhetlig, slik at data ikke lagres på usikre enheter eller at det lages kopier ingen har oversikt over. Institusjonen bør ha på plass gode rutiner på alle nivå for å sørge for at dataene blir organisert på en god måte og at krav til sikkerhet blir ivaretatt. Relevante metadata og dokumentasjon må også samles inn og struktureres på en god måte, slik at all nødvendig informasjon for å forstå og bruke dataene i framtiden er tilgjengelig. 

Aktiv lagring

Det er vanlig å skille mellom det som gjerne kalles aktiv lagring og arkivering, der førstnevnte viser til lagringen av data som er i bruk (i løpet av prosjektperioden). Dette omfatter med andre ord all lagring fram til analyser og bearbeiding er avsluttet og dataene arkiveres og eventuelt publiseres. Aktiv lagring henger derfor nøye sammen med organisering av data og datahåndteringsplan

Når en skal velge lagringsløsning er det særlig tre faktorer som er avgjørende: konfidensialitet, integritet og tilgjengelighet (KIT). Konfidensialitet viser til sikring mot urettmessig innsyn og tilgang. For å finne riktig grad av konfidensialitet, skal det alltid foretas en klassifisering av dataene. I tillegg kommer spørsmål om integritet og tilgjengelighet. Hvor viktig er det at dataene beskyttes fra uautoriserte endringer og ødeleggelse? Hvor viktig er det at de er tilgjengelige til enhver tid? Svarene på disse spørsmålene avgjør hvilke lagringsløsninger som er aktuelle. Lagring av viktige forskningsdata på private datamaskiner og usikrede minnepinner som lett forsvinner, bør unngås. De fleste forskningsinstitusjoner har en IT-avdeling som tilbyr ulike typer lagringsløsninger og systemer som dekker ulike behov for skjerming, tilgang og backup. 

Samhandlingsløsninger

I mange tilfeller er det aktuelt å dele data og andre typer resultater og dokumenter med eksterne samarbeidspartnere eller andre underveis i et prosjekt. Eksempler på slike verktøy og tjenester som er mye brukt, både i og utenfor forskningsmiljøer, er OneDrive, Dropbox og Google drive. Det er imidlertid ikke alle systemer som er egnet for alle typer data, og særlig konfidensielle data stiller ofte høyere krav til sikkerhet enn de vanligste systemene for samhandling tilfredsstiller. Mange institusjoner utvikler derfor egne sikre lagringsområder med egen tilgangsstyring. En annen mulig løsning innebærer kryptering av dataene før de deles. Som med lagringsløsninger generelt, er det å benytte seg av løsninger som tilbys eller anbefales av institusjonens IT-avdeling ofte et godt valg for å ivareta KIT og sikre god forvaltning av forskningsdataene.

Et godt eksempel er USIT (Universitetets senter for informasjonsteknologi) ved UiO, som tilbyr en rekke ulike løsninger for lagring og samhandling.

En flott plattform for samhandling og åpen vitenskap i praksis, er OSF (Open Science Framework). Her kan forskere samarbeide om prosjekter, og enkelt publisere åpent resultater og materiale.