Tutkijan kannattaa miettiä jo ennen tutkimuksen aloittamista, miten hän tulee tutkimusaineistoa käsittelemään ja käyttämään, ja mitä sille tapahtuu tutkimuksen päätyttyä. Huolellinen suunnittelu kannattaa, sillä se parantaa aineiston laatua ja yhtenäisyyttä, säästää aikaa ja vaivaa tutkimuksen teon aikana sekä ehkäisee ennalta datan hävikkiä ja sen tahattomia muutoksia. Tutkimusaineiston hyvä hallinta auttaa tutkijaa vastaamaan rahoittajien vaatimuksiin, parantaa tutkimuksen luotettavuutta ja toistettavuutta, sekä helpottaa aineiston avaamista ja julkaisemista.
Tutkimusaineiston käsittelyssä on hyvä huomioida ainakin seuraavat asiat:
- Millaista ja missä muodoissa aineisto on?
- Miten aineisto dokumentoidaan ja kuvaillaan? Mitä metadatastandardeja sen kuvailussa käytetään? Miten aineisto on löydettävissä ja saavutettavissa?
- Aineiston laatu ja yhtenäisyys: aineiston keräys- ja käsittelyvaiheiden huolellinen dokumentointi
- Lailliset ja eettiset kysymykset: tekijänoikeus ja muut immateriaalioikeudet, omistus- ja käyttöoikeudet, lisenssit, oikeuksien siirto, tekijyys, tutkittavien suostumukset, kestävään kehitykseen liittyvät seikat.
- Tietosuoja: henkilötiedot ja muut salassa pidettävät tiedot
- Kuka tai ketkä ovat vastuussa aineistosta? Kenellä on oikeus käyttää aineistoa ja tehdä sitä koskevia päätöksiä?
- Millaisia resursseja aineiston hyvä hoito edellyttää: taloudelliset ja henkilöresurssit?
- Aineiston tallentaminen, säilyttäminen ja varmuuskopiointi: tallennus- ja siirtoratkaisut, pitkäaikaisen käytön mahdollistavat tiedostomuodot, tiedostojen ja datan muuttujien looginen ja selkeä nimeäminen
- Aineiston suojaus, pääsyoikeudet ja tietoturva
- Aineiston tallentaminen tutkimuksen jälkeen: säilytysaika, säilytyspaikka, tuhoaminen
- Aineiston jakaminen, avaaminen ja jatkokäyttö: avataanko koko aineisto, sen osia vai ainoastaan metadata? Missä aineisto julkaistaan?
- Aineiston avaamiseen liittyvät toimenpiteet: esim. sensitiivisen tiedon anonymisointi, tutkittavien suostumukset aineiston avaamiseen, pysyvä tunniste (PID)
- Olemassaolevien tutkimusaineistojen käyttö edellyttää aineiston alkuperäisen käyttäjän määrittelemää lisenssiä sekä laadukasta metadataa. Tunnettujen data-arkistojen käyttö helpottaa luotettavan tutkimusaineiston löytämistä.
- Viittaamalla dataan annat meriittiä aineiston alkuperäiselle tuottajalle sekä teet käyttämästäsi aineistosta löydettävän ja tutkimuksestasi todennettavan.
- Mahdolliset rahoittajan, julkaisijoiden ja aineiston säilytyspaikan vaatimukset tutkimusaineistojen suhteen.
- Tutkimusaineiston käsittelyvaiheet voi kirjata dokumentiksi, jota kutsutaan aineistonhallintasuunnitelmaksi (data management plan).
Hyvän tutkimusaineistonhallinnan tuloksena on laadukas tutkimusaineisto, joka on käytettävissä myös tulevaisuudessa ja johon on mahdollista viitata.