Siirry pääsisältöön
Turun yliopiston kirjasto

Tutkimusdata ja datanhallinta

Datan avaaminen ja jakaminen

Miksi tutkimusdataa kannattaa jakaa?

Tutkimustieto kuuluu kaikille. Tutkimustieto sisältää sekä tutkimusjulkaisut että tutkimusdatan. Avoimesta tiedosta on hyötyä niin yksittäiselle tutkijalle, tiedeyhteisölle, tieteen rahoittajille kuin koko yhteiskunnalle.

Hyödyt tutkijalle

Hyödyt tiedeyhteisölle

  • Avoimen, valmiiksi kerätyn aineiston käyttö nopeuttaa ja tehostaa tieteen tekoa. Jo kerättyä aineistoa voidaan käyttää uudelleen.
  • Datan jakaminen parantaa aineiston säilyvyyttä tutkimushankkeen päätyttyä.
  • Avoin saatavuus parantaa tutkimuksen innovatiivisuutta sekä verkostoitumista ja tutkijoiden tunnettuutta.
  • Avoin data voi herättää uutta keskustelua tai uusia tutkimuspolkuja.

Hyödyt rahoittajille

  • Rahoittajan on helpompi kohdentaa resurssejaan, kun tietää, mitä aineistoja on olemassa.
  • Väärennöstä tai plagiointia epäiltäessä data on tarjolla arviointia varten.
  • Rahoittaja voi huomioida tiedejulkaisujen lisäksi tutkijan ansiot aineistojen tuottamisessa.

Mitä tulee ottaa huomioon dataa jaettaessa?

  • Mieti ja ota datan jakaminen huomioon jo tutkimushankkeen aloitusvaiheessa. Tässä auttaa mm. tutkimuksen  aineistonhallintasuunnitelman laatiminen.
  • Mieti jo aloitusvaiheessa tutkimukseen liittyviä juridisia ja eettisiä kysymyksiä. Sopikaa tutkimusryhmässä siitä, kuka omistaa datan. Käytä apuna tarvittaessa tutkimuksen juridisia tukipalveluja (legal@utu.fi). Katso myös Tekijänoikeudet ja lisenssit -välilehteä.
  • Ota huomioon myös rahoittajan ja julkaisijoiden mahdolliset vaatimukset.
  • Jos aineistosi sisältää sensitiivistä aineistoa, pidä huoli, että julkaistessasi dataa se on anonymisoitu tietosuoja-asetuksen edellyttämällä tavalla ja tutkittavat ovat suostuneet datan avaamiseen. Katso lisää Tietosuoja-välilehdeltä.
  • Mieti aineiston tiedostomuotoja ja nimeämiskäytäntöjä.
  • Mieti, mihin aiot tallentaa tutkimusaineiston tutkimusprosessin loputtua.

Metadata

Laadukas metadata on kuin tutkimuksen käyntikortti, jonka tutkija voi antaa tutkimuksestaan. Metadata sisältää tiedot datan

  • nimestä
  • tuottamisajankohdasta
  • tuottajasta
  • muodosta
  • aiheesta
  • käyttöoikeuksista.

Metadataan voi sisältyä myös koodien selityksiä, tietoa datan analyysista sekä itse tutkimusprojektista ja datan luojista. Erilaisia metadatastandardeja on olemassa useita, riippuen tiedostomuodosta ja tieteenalasta:

Välineitä metadatan luomiseen ja käsittelyyn:

Lisätietoa löytyy mm. Tietoarkiston aineistonhallinnan käsikirjasta ja Helsingin yliopiston kokoamasta ohjeistuksesta Making a research project understandable - Guide for data documentation. Myös MIT Libraries on koonnut metadatan luomiseksi hyviä ohjeistuksia.

Datan tai metadatan julkaisupaikat

Tutkimusaineistoja voi julkaista eri tavoin:

  1. Data-arkistot mahdollistavat myös datan avaamisen. Katso lisätietoja säilytyspaikoista ja tiedekuntakohtaisista ohjeista sekä IT-palveluiden koostamasta listasta.
  2. Metadatan kuvailuun ja avaamiseen tarkoitetussa Qvain-palvelussa.
  3. Tutkimushankkeen omilla verkkosivuilla

Rahoittajien vaatimuksia aineiston hallinnasta ja avaamisesta

Kotimaisia rahoittajia
Kansainvälisiä rahoittajia

Avoin tutkimuspäiväkirja (Open Notebook Science)

Avoimella tutkimuspäiväkirjalla (Open Notebook Science) tarkoitetaan sitä, että tutkimusprojekti tehdään julkiseksi heti alusta alkaen. Avoin tutkimuspäiväkirja kertoo mm. aineistonkeruun vaiheista, mittaustuloksista. Tavoitteena on tutkimuksen läpinäkyvyyden varmistaminen.

Tutkimuspäiväkirjan voi jakaa esim. tavallisella verkkosivulla tai sosiaalisen median palveluissa. Dokumentteja voi jakaa esim. Turun yliopiston SeaFile-pilvitallennuspalvelun avulla. Katso ohjeet IT-palveluiden sivuilta