Sist endret: 26.11.2020

Søk etter og gjenbruk av data

Det finnes en rekke dataarkiv (data repositories) som gir tilgang til ulike typer kildedata og forskningsdata. Ved prosjektstart og utarbeidelse av datahåndteringsplan kan det være hensiktsmessig å undersøke hva som allerede eksisterer av relevante data som eventuelt kan gjenbrukes. I tillegg bidrar dette til at innsamling av nye data kan gjøres på en slik måte at dataene blir standardisert og sammenlignbare.

Institusjonelle vitenarkiv gir åpen tilgang til publikasjoner som artikler og avhandlinger. Dataarkiv sørger for tilgang til dataene som underbygger forskningen. I dataarkivene er det ofte lenket til den publikasjonen dataene underbygger, enten det er hos et tidsskrift eller et vitenarkiv. Andre aktuelle data av interesse for forskning er offentlige data, registre og helsedata. Dette inkluderer både helt åpent tilgjengelige data eller data som er tilgjengelige etter søknad.

Brukslisenser og datasitering

Åpent tilgjengelige datasett publiseres ofte med en Creative Commons-lisens eller andre brukslisenser (se også Lisensiering av forskningsdata), slik at man enkelt kan se hva man har tillatelse til med tanke på gjenbruk. For noen typer data, for eksempel helseregisterdata, må man som forsker ofte søke om tilgang til og oppfylle spesifikke vilkår før man kan få data utlevert.

Ved gjenbruk av datasett i forskning er det viktig å oppgi kilden til dataene, og sitere dette riktig i publikasjoner. Dette er et grunnleggende forskningsetisk prinsipp som gjelder uavhengning av hvilken formell og juridisk lisens datasettet har blitt publisert med. Datasiteringer er viktige for å anerkjenne og synliggjøre bidrag, og datasett vil i økende grad regnes som en del av den vitenskapelige produksjonen som blir merittert. DataCite har anbefalinger og eksempler på hvordan data som blir gjenbrukt kan siteres i vitenskapelige artikler.

Databaser for datasøk

Det finnes egne søkemotorer som høster fra flere ulike kilder:

  • Bielefeld Academic Search Engine (BASE). Denne søkemotoren er ikke kun for datasett, men også andre typer forskningsresultat og akademiske ressurser, inkludert artikler, avhandlinger, patenter, undervisningsmateriell osv. Det er mulig å avgrense på datasett ved å gå inn i avansert søk.
  • DataCite er en organisasjon som utsteder persistente identifilatorer (DOI) for datasett, og har også muligheter for søk etter data.
  • Google Dataset Search er Googles egen søkemotor for datasett.
  • Elsevier Data Search/Mendeley Data Search er en søkemotor som høster flere arkiv.
  • re3data er et metaarkiv/register over data-arkiv hvor man kan søke etter egnede arkiv innenfor en region eller en vitendisiplin.

 
Nasjonale datakilder og ressurser

  • Norsk senter for forskningsdata (NSD) har blant annet et nasjonalt arkiv med mange datasamlinger som er tilgjengelig for forskere.
  • Microdata.no er en tjeneste som skal gjøre det enklere å få tilgang til SSBs registerdata for bruk i forskning. Tjenesten har innebygget personvern ved hjelp av en anonymiseringsmodell, slik at forskere ikke behøver å søke om tilgang til de underliggende dataene. Forskere og studenter ved institusjoner som har tegnet avtale kan få tilgang.
  • helsedata.no er det oversikt over ulike typer helsedata og registre og informasjon om hvordan man kan få tilgang til disse.
  • Felles datakatalog er en oversikt over tilgjengelige offentlige data.