Siirry pääsisältöön
Turun yliopiston kirjasto

Tutkimusdata ja datanhallinta

Tutkimuksenaikaiset tallennusratkaisut, varmuuskopiointi ja tietoturva

Tietokoneen kiintolevy ja esimerkiksi muistitikut eivät yksistään takaa riittävää suojaa talletetulle aineistolle. Yliopiston IT-palvelut suosittelee tallennukseen aina yliopiston tarjoamaa tallennuspalvelua, jossa he huolehtivat aineiston riittävästä tietoturvasta ja varmuuskopioinnista.

Hyvän tallennuspaikan tunnusmerkit ovat yleisesti ottaen:

  • Automaattinen varmuuskopiointi – Datan häviämisen riski kasvaa, jos varmuuskopio pitää muistaa tehdä itse.
  • Riippumattomuus paikasta eli datan etäkäyttö on mahdollista. 
  • Pääsynhallinta, joka rajoittaa esim. salasanalla kuka pääsee käsiksi tiedostoihin.

Oikean tallennuspalvelun valintaan vaikuttavat kuitenkin lisäksi seuraavat viisi ominaisuutta, joita tallennuspalvelulta kulloisessakin tilanteessa kaivataan:

  • Tietoturva (Tiedon arkaluonteisuus ja luottamuksellisuus)
  • Kapasiteetti (Kuinka isoja tietomääriä on tarve tallentaa?)
  • Suorituskyky (Vasteaika ja siirtonopeus)
  • Käytettävyys/saavutettavuus (Kuinka varmasti dataan pääsee käsiksi juuri silloin kun sitä tarvitsee?)
  • Kestävyys (Kuinka arvokasta data on, onko sitä varaa menettää ja kerätä uudelleen?)

Ohjeet Turun yliopiston tarjoamista tallennuspaikoista ja -palveluista löydät IT-palveluiden Minne voin tallentaa dataa -sivulta.

Neuvoja ja apua tietoturva-asioissa saat IT-palvelujen Tietoturva-sivulta.

Voit myös ottaa yhteyttä data@utu.fi

Tiedostojen organisointi ja nimeäminen

Datan organisointi- ja nimeämiskäytännöt kannattaa suunnitella jo projektin alussa. Varsinkin jos aineistoa tallentaa useampi ihminen, on  tärkeää tehdä erillinen tallennusohje, jotta tutkimusprojektin tiedostoista saadaan yhtenevät.

Organisointi ja säännönmukainen nimeäminen auttaa

  • välttämään sekaannuksia tutkimusprosessin aikana ja datan analysointivaiheessa.
  • jakamaan dataa tutkimusryhmän sisällä.
  • varmistamaan datan säilymisen, huolimatta muutoksista tutkimusryhmän kokoonpanossa.
  • varmistamaan datan luettavuuden ja ymmärrettävyyden sen jälkeenkin, kun tutkimusprosessi on jo päättynyt.
  • selvittämään, mitä data sisältää ja millä periaatteilla se on koottu.

Data Organisation ABC workshop - Datan Organisoinnin ABC työpajan materiaalit Zenodossa. Työpajan järjesti Helsingin yliopisto ja CSC.

Glasgow'n yliopisto (englanniksi) antaa tutkimusdatasivuillaan hyviä vinkkejä datan organisointiin ja tiedostojen nimeämiseen.

Miksi dokumentoida dataa?

Hyvällä datan dokumentaatiolla mahdollistetaan datan

  • löydettävyys
  • saavutettavuus
  • ymmärrettävyys
  • arvioitavuus
  • pitkäaikaissäilytys
  • aineiston uudelleenkäytettävyys.

Eri tieteenaloilla on erilaisia dokumentointikäytäntöjä, joita kannattaa seurata. Yksinkertaisimmillaan datan yhteyteen kannattaa luoda readme-tiedosto, jossa kokonaisuus on kuvailtu. Koodia esimerkiksi voi tallentaa sopivaan arkistoon tai GitHubiin, joiden kautta ne saavat pysyvän DOI-tunnisteen. Dokumentointi voi olla työlästä, mutta sitä tuskin koskaan on liikaa. Sen sijaan liian niukka dokumentaatio voi estää uudelleenkäyttöä