Sist endret: 02.12.2020

Lisensiering av forskningsdata

Forskningsdata som deles og tilgjengeliggjøres åpent, bør publiseres med en lisens eller bruksvilkår som gjør det tydelig hva som er rammene for videre bruk og deling. Dette er relevant både for gjenbruk og publisering av data. Denne artikkelen gir en kort introduksjon til hvordan forskningsdata kan lisensieres.

Åpen deling og publisering av forskningsdata er et viktig bidrag til transparent, reproduserbar og åpen forskning. Tradisjonelt har publikasjoner (artikler og bøker) vært regnet som det viktigste, og kanskje også eneste, «tellende» akademiske resultatet. Nye digitale verktøy i kombinasjon med krav og forventinger om tilgjengeliggjøring av av forskningsresultater, er viktige drivere som nå fører til at et økende antall datasett blir publisert og gjort tilgjengelig.

Sammenlignet med publisering av akademiske artikler og bøker, vil det ofte være flere vurderinger som må tas før åpen publisering av datasett. For det første må det vurderes om det er grunner til at data ikke bør være åpent tilgjengelig, og i tillegg kan det være litt flere hensyn knyttet til rettigheter, reguleringer og valg av lisens.

I tillegg til formelt juridisk vern, som er kort beskrevet under, er det viktig å være klar over at forskningsetiske retningslinjer og normer også gjerne legger ytterlige føringer. Forskere skal alltid oppgi sine kilder og referere til data som gjenbrukes, selv om det skulle være data som er publisert uten formelle krav til sitering. Tilsvarende er det også i tråd med beste praksis å i størst mulig grad åpent dele materiale og resultater fra forskning, for å sikre transparens, etterprøvbarhet og gjenbruk. 

Vern og regulering av forskningsdata

Det er flere regler og lovverk som i ulike tilfeller regulerer rettigheter til, bruk av og tilgjengelighet til data. Noen typer data vil gjennom lovverk og retningslinjer kunne regnes som sensitive eller konfidensielle, og skal ikke deles åpent. Et eksempel på dette kan være persondata, som reguleres av personvernforordningen. Les mer om dette i artikkelen om sensitive data og informasjonssikkerhet. Vilkår og begrensninger ved bruk av data kan også reguleres gjennom kontrakter eller avtaler, for eksempel ved samarbeidsavtaler mellom prosjektpartnere eller avtaler ved utlevering og overføring av data fra andre aktører.

Forskningsdata vil i noen tilfeller kunne ha et automatisk vern gjennom åndsverkloven, enten ved opphavsrett eller databasevern. Åndsverk defineres i loven som «litterære eller kunstneriske verk av enhever art, som er uttrykk for original og individuell skapende åndsinnsats» (§2). Det vil si at enkeltdata fra forskningsprosjekter ofte ikke vil være vernet, da de gjerne ikke er resultat av en skapende innsats. Eksempler på dette er målinger, fakta og opplysninger. Samtidig vil det i noen fagfelt være vanlig at data og kilder som brukes i forskning allerede har såkalt verkshøyde (vil vurderes som åndsverk), for eksempel litterære tekster eller fotografier. Opphavsretten inkluderer både kommersielle rettigheter, som kan overføres til andre (for eksempel arbeidsgiver), og ideelle rettigheter, som alltid vil følge opphaveren.

Databasevernet som er beskrevet i §24 i åndsverkloven (også kalt sui generis-vern)  vil også kunne være relevant for forskningsdata. Databaser hvor «innsamling, kontroll eller presentasjon av inholdet innebærer en vesentlig investering», vil gi den som fremstilte databasen «enerett til å råde over hele eller vesentlige deler av databasens innhold ved uttrekk fra eller gjenbruk av databasen». Det er verdt å merke seg formuleringene vesentlig investering, og hele eller vesentlige deler av databasen. Dette innebærer at det vil være en terskel for hva slags databaser og data som vernes etter denne paragrafen. I tillegg vil det være tillatt å bruke «uvesentlige» deler selv der hvor databasen er beskyttet. Dette kan være relevant for forskere som ønsker å bruke data fra andre kilder, men hvor disse ikke er utstyrt med lisens.

Data som brukes eller samles inn i forskning vil i mange tilfeller ikke oppnå vern gjennom åndsverkloven. Noen typer kan imidlertid være vernet ved opphavsrett, andre gjennom databasevern, mens noen samlinger av data kan være vernet både ved opphavsrett og databasevern. Et eksempel på det siste kan være en større database av fotografier, hvor hvert enkelt bilde kan være vernet av opphavsrett, og den totale samlingen er vernet som database. 

Opphavsrett (og databasevern) er en av flere immaterielle rettigheter, se også avsnittet Immaterielle rettigheter i artikkelen om Institusjonelle strategier og retningslinjer

Valg av lisens for forskningsdata

Her beskrives kort noen av de mest brukte standardlisensene ved deling og publisering av data. Disse lisensene er i hovedsak opphavsrettslisenser, slik som de ulike Creative Commons-lisensene (nyeste versjon av CC-lisensene inkluderer også databasevern). Særlig CC-BY, er en del brukt ved tilgjengeliggjøring av data, men kanskje særlig ved publisering av artikler og bøker. De ulike CC-lisensene er nærmere beskrevet i artikkelen Lisensiering av publikasjoner.

CC0 (Creative Commons Zero)

CC0 er teknisk sett ikke en lisens, men et verktøy for å dedikere et verk til «det fri» eller «Public domain». Det vil si at opphaver sier fra seg opphavsretten og databasevern (i den grad det er mulig etter lovgivningen), slik at andre kan fritt kan bruke materialet. Selv om CC0 ikke krever navngivelse ved gjenbruk og redistribusjon, vil det forskningsetisk være god praksis å alltid referere til sine kilder og hvordan disse har blitt bearbeidet. I tillegg anbefales det ofte å bruke CC0 ved publisering av datasett for å unngå utfordringer med «attribution stacking». Ved å kombinere data fra mange ulike kilder og med ulke lisenser kan det bli komplekst å skulle navngi alle kilder og deler av datasett på riktig måte. CC0 sikrer derfor at det blir enklest mulig med faktisk gjenbruk av data i andre sammenhenger.

For materiale og ressurser som ikke er beskyttet av åndsverkloven, er det også mulig å benytte Public Domain-merket.

NLOD (Norsk lisens for offentlige data)

NLOD er en lisensavtale som er utviklet av Kommunal- og moderniseringsdepartementet. Denne brukes mye ved tilgjengeliggjøring av data fra offentlige virksomheter, og tillater kopiering, bruk og tilgjengeliggjøring under visse vilkår. NLOD er kompatibel med den nyeste versjonen av CC-BY (4.0), slik at forskere som gjenbruker data publisert under NLOD kan publisere det deriverte datasettet med en CC-BY (4.0). 

Open Data Commons

Open Data Commons, en del av Open Knowledge Foundation, har utviklet et sett av åpne lisenser spesifikt for databaser. Dette betyr at disse lisensene kun dekker databaserettighetene og opphavsrett tilknyttet selve databasen, og ikke selve innholdet (i motsetning til CC-lisensene, som også dekker opphavsrett for innholdet).