Turun yliopisto tukee vahvasti FAIR-periaatteita, joiden mukaisesti tutkimusaineiston tulisi olla niin avointa kuin mahdollista, niin suljettua kuin tarpeellista. Koko aineiston avaaminen ei aina ole mahdollista tai järkevää, mutta tutkimusaineistojen metatiedot voidaan avata. Turun yliopistolla ei ole tutkimusaineiston avaamiseen omaa tietokantaa, vaan avaaminen tehdään joko kansallisilla tai kansainvälisillä alustoilla eli repositoriossa/data-arkistossa.
Pitäisikö kaiken datan olla avoimesti saatavilla?
Vastaus on yksinkertaisuudessaan EI. Arviota tehdessäsi käy läpi Digital Curation Centerin (DCC) tarkistuslistan (englanniksi) kanssa sitä, mikä data on sellaista, että se kannattaa säilyttää.
Tutkimusaineistojen jatkokäytön kannalta tutkimusdatan tulisi noudattaa nk. FAIR-periaatteita, eli datan tulisi olla löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimiva (Interoperable) ja uudelleenkäytettävissä (Re-usable).
1. Löydettävyys -Findable
2. Saavutettavuus -Accessible
3. Yhteentoimiva -Interoperable
4. Uudelleenkäytettävä -Re-Usable
Tutkimusaineisto kannattaa julkaista ensisijaisesti oman tieteenalasi tai tutkimusaiheesi tietoarkistossa eli repositoriossa. Kun julkaiset aineistosi tieteenalakohtaisessa tietoarkistossa, päätyy se todennäköisemmin oman alasi tutkijoiden löydettäväksi.
Yleisissä ja monitieteisissä tietoarkistossa tutkimusaineiston löydettävyys oman alan tutkijoille saattaa olla vaikeampaa.
Oikea tietoarkisto vastaa seuraaviin kysymyksiin:
Huom! EU rahoittajat vaativat usein sertifikoitua datarepositoriota.
Voit etsiä eri arkistoja seuraavista palveluista:
Erityispiirteitä esitellään myös Harvardin kirjaston sivustolla.
Huom! Muista tarkastella rahoittajasi linjauksia ja vaatimuksia repositoriota valitessa.
Aina ei ole tarvetta avata koko tutkimusaineistoa, pelkkä löydettävyyden takaava metadata riittää. Metatietojen tulee kuitenkin olla tarpeeksi kattavat, jotta niiden kautta ymmärretään tutkimusaineistoa.
Monessa arkistossa on mahdollista avata vain metatiedot, vaikka koko tutkimusaineistokin olisi talletettu arkistoon. Kaikissa tämä ei kuitenkaan ole mahdollista.
Metadatan tuottaminen kannattaa aloittaa heti tutkimuksen alussa. Myöhemmin kirjoitettava metatieto on aikaavievää. Katso vinkit metadatan kirjoittamiseen tämän oppaan kohdasta Tietoaineiston dokumentointi, kuvailu ja metadata.
Pysyvällä tunnistellaan (persistent identifier, PID) tarkoitetaan verkkoympäristössä käytettävää tunnistetta, jolla yksilöidään esim. julkaisu, henkilö tai tutkimusaineisto.
Turun yliopisto suosittaa jokaiselle tutkijalle oman ORCID-tunnisteen hankkimista. Tunnisteesta on hyötyä esimerkiksi tilanteissa, joissa tutkija vaihtaa nimeä tai nimenkirjoitusasuja on useita tai saman nimisiä tutkjioita on useita. Lisätietoa ORCID-tunnisteesta UTUCRIS-oppaassa.
Tieteellisissä julkaisuissa pysyvän tunnisteen myöntää julkaisualusta, eli usein lehden tai monografian kustantaja.
Julkaistun tutkimusdatan tunnisteena voidaan käyttää esim. URN-tunnisteetta (kotimaisista tietoarkistoista esim- Etsin, Tietoarkisto ja Kielipankki käyttävät URN-tunnistetta) tai DOI. DOI-tunnistetta käytetään laajasti kaupallisten kustantajien ja alustojen järjestelmissä.
Tieteellisten artikkelien kirjoittajia voidaan pyytää lisäämään artikkeliin data availability statement tai data access statement (DAS). Sen tarkoituksena on kertoa, missä artikkeliin liittyvä tutkimusdata on saatavilla ja millä ehdoilla. DASiin voidaan sisällyttää mahdollinen linkki datasettiin.
Kustantajilla on omat ohjeet DASin muodostamiseksi ja sijoittamiseksi artikkelissa, ks. esim. Taylor & Francis, Springer ja Elsevier.
Yleisesti datan saatavuudesta katso esim. PLOS ONE -Data Availability, Nature -DAS
Datajulkaisut ovat vertaisarvioituja dokumentteja, jotka sisältävät mm. tiedot datan keruu- ja analyysimenetelmistä. Datajulkaisu julkaistaan vertaisarvioidussa lehdessä. Datajulkaisun avulla saa tutkimukselle lisää näkyvyyttä ja ne antavat kirjoittajille tunnustusta samalla tavalla kuin tieteelliset artikkelit.
Zenodo on yleiskäyttöinen data-arkisto, joka sopii monenlaiselle datalle. Zenodo on CERNin tuottama, jonka rahoitus tulee EU:lta.
Ominaisuuksia:
Tutustu Turun yliopiston yhteisöön Zenodossa. TY suosittelee yhteisön käyttöä. Kun lisäät aineistosi Zenodon TY yhteisöön, kirjaston asiantuntijat käyvät hyväksymässä aineistosi ja siihen liitetyn metatiedon.
Dryad on monitieteinen tutkimusdata-arkisto, jonka painopiste on kuitenkin erityisesti luonnontieteellisen ja lääketieteellisen tutkimusaineistoissa.
Ominaisuuksia:
Figshare on monitieteinen arkisto, johon voit ladata aineistosi ilmaiseksi
Figsharen käyttäjien kannattaa tutustua käyttöehtoihin ja säilytysaika lupauksiin.
Harvard Dataverse on avoimen lähdekoodin data-arkisto, jota kehitetään Harvardin yliopiston kirjastossa. Harvard Dataversen lähdekoodi on monen muunkin data-arkiston pohjana.
Erityispiirteitä:
Open Science Framework on yleisarkisto, joka tarjoaa tutkijoille apua aineistonhallinnassa tutkimuksen kaikissa vaiheissa. Open Science Franmeworkin erityispiirteitä:
Kotimainen Tietoarkisto arkistoi sekä kvalitatiivista että kvantitatiivista tutkimusaineistoja.
Tietoarkisto tarkistaa ja dokumentoi aineiston. Tietoarkiston erityispiirteitä: