Sist endret: 18.11.2020

Arkivering og publisering av forskningsdata

Tilgjengeliggjøring av forskningsdata er et viktig aspekt ved åpen vitenskap. Dette er også et område hvor mange fagmiljø og institusjoner foreløpig har lite erfaring. Denne artikkelen beskriver hvordan bibliotek kan legge til rette for arkivering og publisering av forskningsdata.

Selv om det til nå har vært mest fokus på åpen tilgang til publikasjoner i den norske UH-sektoren, begynner nå flere finansiører å rette oppmerksomheten mot forskningsdata, og krever gjerne at dataene skal gjøres offentlig tilgjengelige så sant det er mulig. 

Ikke alle typer data skal publiseres åpent. Sensitive data, som for eksempel helseopplysninger, forretningshemmeligheter eller data som kan utgjøre en sikkerhetstrussel skal som regel ikke tilgjengeliggjøres, men være «så lukket som nødvendig». Også i slike tilfeller må institusjonen ha en løsning for langtidsarkivering på en sikker måte, og ofte vil publisering av metadata være mulig og tilrådelig.

Selv om en del tidsskrift tilbyr egne publiseringsløsninger for data, er det mest hensiktsmessig å publisere dataene i et arkiv beregnet på forskningsdata. En viktig del av en støttetjeneste for forskningsdata er gi råd til forskere om hvor det er mest hensiktsmessig å arkivere og publisere data, se informasjonsartikkelen Arkivering og publisering av data for informasjon om aktuelle arkiv og forskjellen på disse. I tillegg bør institusjonen vurdere å tilby et institusjonelt arkiv for forskningsdata, som vil kunne være et generisk tilbud til alle forskere og studenter. Et slikt arkiv vil også legge til rette for at faggrupper, institutt og andre enheter på institusjonen kan forvalte samlinger av forskningsdata uten at det er avhengig av enkeltforskere eller forskningsprosjekt med begrenset varighet. I Norge var UiT tidlig ute med eget institusjonsarkiv og drifter i dag det nasjonale dataarkivet DataverseNO som brukes som institusjonsarkiv ved flere norske institusjoner.

Kuratering av data

I bred forstand innebærer kuratering av data alle former for behandling og bearbeiding som har til hensikt å vedlikeholde eller øke brukspotensialet på kort eller lang sikt. Det finnes derfor mange nivå av kuratering, fra manuell kontroll og eventuelt tilføying av manglende metadata og dokumentasjon på datasettnivå, til mer omfattende prosesser der data blir aktivt bearbeidet, tagget med metadata og koblet til andre informasjonskilder.

I de fleste tilfeller brukes kuratering imidlertid om manuell tilrettelegging av datasett for arkivering og publisering i henhold til retningslinjer for spesifikke dataarkiv. Kravene til kuratering er gjerne basert på FAIR-prinsippene og er dermed en prosess som er ment å øke gjenbruksverdien av data. Mye kuratering gjøres av forskere selv, men hvis institusjonen har en egen støttetjeneste for forskningsdata, er det vanlig at noen har rollen som datakurator på et mer overordnet nivå. Dette kan innebære alt fra dialog med forskere om hva som skal til for at datasettet blir godkjent og publisert i det institusjonelle arkivet (eller andre arkiv), til å aktivt gå inn og gjøre endringer (se også informasjonsartikkel om arkivering og publisering av data). 

Kuratering kan være en relativt tidkrevende prosess og er kompetansekrevende. I noen tilfeller er datakurator en egen stillingstittel, og innenfor enkelte fagfelt har det utviklet seg fagspesifikke kuratorroller, for eksempel biokuratorer som kuraterer data for biologiske databaser. For et eksempel på beste praksis for kurateringsprosessen, se DataverseNOs retningslinjer for kuratering.

Søk og gjenbruk av data

Gjenbruk av data er et viktig element i åpen vitenskap. En av årsakene til at det lønner seg å publisere datasett gjennom etablerte dataarkiv, er at de da blir enklere å finne. Det finnes flere gode verktøy for å finne aktuelle datasett, og flere former for lisensiering det er lurt å kjenne til, både med tanke på publisering og gjenbruk.

  Bibliotekets tilbud: Organisering og samarbeidspartnere:
Nivå 1:

Nettbasert informasjon om ulike muligheter for arkivering/publisering    
Nettbasert informasjon om tilgjengelige fagspesifikke arkiv og generiske arkivløsninger


Nettbasert informasjon og retningslinjer for arkivering og mulig publisering av sensitive data/persondata 

Nettbasert informasjon om søk og gjenbruk av data

Webredaktør/webansvarlig ved institusjonen 
Nivå 2:

Institusjonsarkiv for forskningsdata

Kuratering av datasett

Kursing og opplæring i datasøk og publisering av data

IT-avdelingen, fakultet, institutt, forskningsadministrasjon 
 
Nivå 3:

Fagspesifikk kuratering av datasett

Tilpasset veiledning for ulike brukergrupper 

IT-avdelingen, fakultet, institutt, forskningsadministrasjonen, fagreferenter/fagansvarlige ved biblioteket