Skip to main content
Turun yliopiston kirjasto

Tutkimusdata

Tutkimuksenaikaiset tallennusratkaisut, varmuuskopiointi ja tietoturva

Tietokoneen kiintolevy ja esimerkiksi muistitikut eivät yksistään takaa riittävää suojaa talletetulle aineistolle. Yliopiston IT-palvelut suosittelee tallennukseen aina yliopiston tarjoamaa tallennuspalvelua, jossa he huolehtivat aineiston riittävästä tietoturvasta ja varmuuskopioinnista.

Hyvän tallennuspaikan tunnusmerkit ovat yleisesti ottaen:

  • Automaattinen varmuuskopiointi – Datan häviämisen riski kasvaa, jos varmuuskopio pitää muistaa tehdä itse.
  • Riippumattomuus paikasta eli datan etäkäyttö on mahdollista. 
  • Pääsynhallinta, joka rajoittaa esim. salasanalla kuka pääsee käsiksi tiedostoihin.

Oikean tallennuspalvelun valintaan vaikuttavat kuitenkin lisäksi seuraavat viisi ominaisuutta, joita tallennuspalvelulta kulloisessakin tilanteessa kaivataan:

  • Tietoturva (Tiedon arkaluonteisuus ja luottamuksellisuus)
  • Kapasiteetti (Kuinka isoja tietomääriä on tarve tallentaa?)
  • Suorituskyky (Vasteaika ja siirtonopeus)
  • Käytettävyys/saavutettavuus (Kuinka varmasti dataan pääsee käsiksi juuri silloin kun sitä tarvitsee?)
  • Kestävyys (Kuinka arvokasta data on, onko sitä varaa menettää ja kerätä uudelleen?)

Ohjeet Turun yliopiston tarjoamista tallennuspaikoista ja -palveluista löydät IT-palveluiden Minne voin tallentaa dataa -sivulta.

Neuvoja ja apua tietoturva-asioissa saat IT-palvelujen Tietoturva-sivulta.

data@utu.fi

Tiedostojen organisointi ja nimeäminen

Datan organisointi- ja nimeämiskäytännöt kannattaa suunnitella jo projektin alussa. Varsinkin jos aineistoa tallentaa useampi ihminen, on  tärkeää tehdä erillinen tallennusohje, jotta tutkimusprojektin tiedostoista saadaan yhtenevät.

Organisointi ja säännönmukainen nimeäminen auttaa

  • välttämään sekaannuksia tutkimusprosessin aikana ja datan analysointivaiheessa.
  • jakamaan dataa tutkimusryhmän sisällä.
  • varmistamaan datan säilymisen, huolimatta muutoksista tutkimusryhmän kokoonpanossa.
  • varmistamaan datan luettavuuden ja ymmärrettävyyden sen jälkeenkin, kun tutkimusprosessi on jo päättynyt.
  • selvittämään, mitä data sisältää ja millä periaatteilla se on koottu.

Glasgow'n yliopisto antaa tutkimusdatasivuillaan hyviä vinkkejä datan organisointiin ja tiedostojen nimeämiseen.

Miksi dokumentoida dataa?

Hyvällä datan dokumentaatiolla mahdollistetaan datan

  • löydettävyys
  • saavutettavuus
  • ymmärrettävyys
  • arvioitavuus
  • pitkäaikaissäilytys
  • aineiston uudelleenkäytettävyys.

Tieteenalasta riippuen dokumentoitiin on erilaisia käytäntöjä, joita kannattaa seurata. Yksinkertaisimmillaan datan yhteyteen kannattaa luoda readme-tiedosto, jossa kokonaisuus on kuvailtu. Koodia esimerkiksi voi tallentaa sopivaan arkistoon tai GitHubiin, joiden kautta ne saavat pysyvän DOI-tunnisteen. Dokumentointi voi olla työlästä, mutta sitä tuskin koskaan on liikaa. Sen sijaan liian niukka dokumentaatio voi estää uudelleenkäyttöä