Sist endret: 29.10.2020

Organisering av data

Data (og metadata) skal organiseres og struktureres på en slik måte at det er oversiktlig og lett å finne fram til riktig versjon og spore eventuelle endringer. Det skal også være mulig å åpne filene i fremtiden, selv om programvaren eller utstyret som er brukt under arbeidet er utgått eller kommet i ny versjon. Det er derfor viktig å tenke langsiktig helt fra starten når det gjelder organisering av datafilene.

Filformat

Det er viktig å tenke på filformater og bruk av åpen programvare fremfor proprietær (produsenteid) programvare. Ved arkivering av datasett, bør dokumentet derfor ofte lagres i et annet format enn det som ble brukt underveis, for eksempel ren tekst fremfor Microsoft Word, og CSV fremfor Microsoft Excel.  

Versjonskontroll

Ofte blir det laget nye versjoner av datafiler, og det anbefales at hver ny versjon får et unikt navn. Vanlige måter å gjøre dette på er å nummerere versjonene, for eksempel «v1», «v2», eller «v2.1». En annen metode er å inkludere informasjon om eventuelle endringer som er gjort, for eksempel «cropped» eller «sortert».

Navngiving av filer

For å holde oversikten og for å gjøre det mulig å nyttiggjøre seg dataene i fremtiden, bør en også være nøye med navngivning og datering av filer. Her finnes det internasjonale konvensjoner som med fordel kan følges.

Hvordan navngi filer:

 

Beste praksis

Eksempler

Lengde

Hold filnavnene innenfor 32 tegn (helst færre)

32tegnerakkuratsålangtsomdetteer

Skilletegn

Ikke bruk*:

Mellomrom

Bindestrek eller skråstrek

Punktum (untatt før filendelser)

Spesialtegn (&$#§*^`=()[] osv...)

Bruk:

Understrek i stedet for mellomrom (_)

camelCase** (stor bokstav skiller ord i sammenhengende rekke)

 

 

 

 

 

 

 

 

name_date.txt

Handout_fileNaming_20180215.pdf

Datoer

Vær konsekvent i datoformateringen, da blir det lett å sortere filene i etterkant

ÅÅÅÅMMDD

Nummerering

Bruk to siffer i angivelsen av sekvensielle tall.

Dette sørger for at filene holder seg i riktig rekkefølge når de sorteres på navn

For en sekvens på 1-10 bruk: 01-10

For en sekvens på 1-100 bruk: 001-010-100

Ikke bruk: ProjID_v1.csvProjID_v12.csv

Bruk:

ProjID_v01.csvProjID_v12.csv

* Spesialtegn som @ og % kan tolkes ulikt av ulike programmer eller operativsystemer. Det samme gjelder for mellomrom, hvis mellomrommet egentlig er et linjeskift. Punktum brukes tradisjonelt kun foran filendelser. Ved å unngå å bruke spesialtegn, fjernes en stor potensiell feilkilde i datafilene dine.  

** Hvis det trengs en metode for å visuelt skape «skiller» i filnavnene dine, forsøk «camelCase» (dvs. tekst hvor mellomrommene mellom ordene er erstattet med stor bokstav, f.eks.: myCoolData) og/eller understrek. Tegnet for understrek tolkes likt på tvers av programmer og operativsystemer.