Skip to main content

Datahanteringsplaner

Kvalitetssäkrad och korrekt hantering av data underlättas ofta med en genomtänkt datahanteringsplan (DHP). Forskningsfinansiärer både nationellt och inom Europa och USA kräver numer att man som forskare skriver en datahanteringsplan för sitt forskningsprojekt. Detta gäller i dagsläget för Karolinska institutets del främst beviljade projekt från Vetenskapsrådet, Horizon 2020, European Research Council och många amerikanska finansiärer.

Vetenskapsrådet

Forskare på KI som blir beviljade medel från Vetenskapsrådet ska från och med 2019 skriva en datahanteringsplan för sitt projekt. Man behöver däremot inte skicka in den till Vetenskapsrådet, men den ska finnas på plats när du påbörjar ditt projekt och det är viktigt att hålla den uppdaterad under projektets gång.

Följande beskrivning är direkta instruktioner från Vetenskapsrådet på vad en datahanteringsplan bör innehålla:

Förutom den centrala dokumentationen nedan bör en datahanteringsplan även innehålla grundläggande administrativa uppgifter såsom projekttitel, projektledare, diarienummer eller motsvarande, datum och version av datahanteringsplanen.

  1. Beskrivning av data – återanvändning av befintliga data och/eller produktion av nya data: 
    • Hur kommer data samlas in, skapas eller återanvändas?
    • Vilka typer av data kommer skapas och/eller samlas in, vad gäller dataformat och mängd/volymer data? 
  2. Dokumentation och datakvalitet: 
    • Hur kommer materialet att dokumenteras och beskrivas med tillhörande metadata om struktur, standarder och format för beskrivningar av innehållet, insamlingsmetod m.m.? 
    • Hur kommer kvalitet hos data säkerställas och dokumenteras (till exempel repeterade mätningar, validering av datainmatning, m.m.)? 
  3. Lagring och säkerhetskopiering: 
    • Hur säkerställs lagring och säkerhetskopiering av data och metadata under forskningsprocessen? 
    • Hur säkerställs datasäkerhet och kontrollerad tillgång till data avseende till exempel hantering av känsliga data och personuppgifter? 
  4. Rättsliga och etiska aspekter:
    • Hur säkerställs att data hanteras enligt de rättsregler som gäller till exempel hantering av personuppgifter, sekretess och immaterialrätt? 
    • På vilket sätt säkerställs det att data hanteras på rätt sätt utifrån etiska aspekter? 
  5. Tillgängliggörande och långtidsbevarande: 
    • Hur, när och var kommer forskningsdata eller information om data (metadata) att tillgängliggöras? Finns det eventuella villkor, embargon och begränsningar kring tillgång till och återanvändning av data att ta hänsyn till? 
    • På vilket sätt säkerställs långsiktigt bevarande och av vem? Hur kommer urval av data för långtidsbevarande att göras? 
    • Kommer det att krävas särskilda system, mjukvaror, källkod eller andra typer av tjänster för att kunna förstå, ta del av eller använda/analysera data långsiktigt? 
    • På vilket sätt säkerställs användning av beständiga identifierare (PID) till exempel DOI? 
  6. Ansvar och resurser: 
    • Vem ansvarar för datahanteringen och eventuellt stödjer arbetet med detta under arbetet med forskningsprojektet? Vem har ansvar för datahantering, fortsatt förvaltning och långtidsbevarande efter projektavslut? 
    • Vilka resurser (kostnad, arbetsinsats eller annat) kommer att krävas för datahantering (inklusive lagring, säkerhetskopiering, tillgängliggörande och hantering för långtidsbevarande)? Vilka resurser kommer behövas för att tillse att data uppfyller FAIR-principerna?

Horizon 2020

Från 2017 omfattas samtliga beviljade H2020-projekt av ”the Open Research Data pilot” (ORD). Det innebär även att för samtliga H2020-projekt i praktiken beviljade från 2018 och framåt bör tillhandahålla en datahanteringsplan (DHP), senast 6 månader efter att H2020-projektet startats.

Alternativet att inte skriva en datahanteringsplan för sitt H2020-projekt är om man begärt ”opt out” och därmed inte deltar i den Öppna Data-piloten. H2020 uppmuntrar alla att skriva en datahanteringsplan oavsett, men det är på frivillig basis om man begärt ”Opt out” (läs mer nedan om "opt out").

En datahanteringsplan för ett H2020-projekt ska beskriva hur du hanterar dina forskningsdata under hela dess livscykel. Som ett led i att göra dina data FAIR bör din datahanteringsplan beskriva:

  • Hanteringen av forskningsdata både under och efter projektets slut
  • Vilka data som kommer samlas in, processas och/eller genereras
  • Vilken metod och vilka standarder som kommer tillämpas
  • Om data kommer kunna delas/publiceras open access
  • Hur data ska kureras och bevaras (även efter projektets slut).

Känsliga data – “Opt Out”

Forskningsprojekt inom H2020 kan välja bort öppen tillgång till forskningsdata. Detta kallas ”opt out” och gäller då data som av olika anledningar är känsliga eller t.ex. belagda med sekretess. ”Opt out” kan motiveras och begäras under alla stadier av ett forskningsprojekt.

Kostnader

Kostnader i samband med att öppet tillgängliggöra forskningsdata, och även att skriva datahanteringsplaner ger grund för att ansöka om ekonomiskt stöd för alla H2020-anslag.

European Research Council (ERC)

Följande punkter ska adresseras i datahanteringsplanen för ERC-finansierade projekt som deltar i EU:s ORD-pilot:

  • Göra det möjligt att hitta projektets data.
  • Göra projektets data öppet tillgängliga (Open Access).
  • Göra projektets data interoperabla.
  • Öka återanvändningen av projektets data.
  • Allokering av resurser och datasäkerhet.

Datahanteringsplanen ska dessutom specificera om och varför vissa dataset inte görs öppet tillgängliga och anledningen till detta ska också anges.

FAIR-principerna

EU och Horizon 2020 anger att forskningsdata ska uppfylla de så kallade FAIR-principerna. I december 2018 har även Vetenskapsrådet publicerat dessa principer i en svensk rapport ”Kriterier för FAIR forskningsdata”. Indirekt innebär detta att man även behöver ta FAIR-principerna i beaktande när man hanterar sina data och sin datahanteringsplan.

Begreppet FAIR står för att data ska vara

  • Sökbara (Findable)
  • Tillgängliga (Accessible)
  • Interoperabla (Interoperable)
  • Återanvändningsbara (Reusable).

Kontakt

Har du frågor om datahanteringsplaner? Kontakta Research Data Office: rdo@ki.se