Siirry pääsisältöön
Turun yliopiston kirjasto

Suomen Akatemian aineistonhallintasuunnitelma

1. Aineiston yleiskuvaus

Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodossa aineisto on? Esitä myös karkea arvio tuotettavan/kerättävän aineiston koosta. Suomen Akatemia suosittelee taulukko- tai luettelomuotoa eri aineistosettien kuvaamiseen.

Osoita että tunnistat tutkimusaineistosi eri aineistotyypit ja ymmärrät, millaisia toimenpiteitä niiden elinkaareen liittyy. Tarkista, että aineistokuvaus vastaa tutkimussuunnitelmaasi.

Anna aineistotaulukossa seuraavat tiedot aineistosetittäin:

  • Arvioitu tiedostokoko
  • Aineiston alkuperä
    • aiemmin kerätty, uudelleen käytettävä aineisto
    • tutkimusta varten kerätty aineisto
    • tutkimuksessa tuotettava aineisto
  • Tallennusmuoto
    • Mahdollisia tiedostomuotoja ovat esim. .csv, .txt, .docx, .xslx, .tif. Tärkeää on, että aineiston tallennuksessa käytetyt tiedostomuodot tukevat aineiston mahdollista jatkokäyttöä.
  • Tutkimuksen aikainen tallennuspaikka
    • Seafile, Taltio, GitLab
  • Kuka omistaa aineiston?
    • Sopimustutkimusessa UTU  
  • Metadata eli miten huolehdit juuri tämän aineistosetin kuvailusta
    • Readme-tiedostot, laitteiston metadata, elektroniset päiväkirjat
  • Voiko aineiston avata tutkimuksen jälkeen?
    • ainakin metadatan voi avata
  • Mihin aineistosetti tallennetaan tutkimuksen jälkeen?
    • Tieteenalakohtainen tietoarkisto (datarepositorio)
  • Sisältääkö aineisto arkaluonteista tai sensitiivistä tietoa?
    • Jos keräät ja/tai käsittelet henkilötietoja tai muutoin luottamuksellisia tai salassa pidettävää tietoa, kuvaa ne omina aineistosetteinään arkaluontoisuutensa tai sensitiivisyytensä perusteella.

Erityiset ja epätavalliset ohjelmat, jotka koodataan tai tuotetaan hankkeelle, tulee mainita ja avata. 

  • Erityisesti tulee huolehtia siitä, että ohjelman käyttämät tallennus- ja tiedostomuodot ovat jatkokäyttöä ajatellen yhteensopivia standardisoitujen tietomallien kanssa.

Jos käytät jotakin tiettyä laitteistoa aineiston keruuseen tai tuottamiseen, kuvaile, millaista dataa se tuottaa. Jos data noudattaa jotain metadatastandardia, mainitse myös se.

Esimerkkejä aineistotyyppien kuvailusta:

AIneistosetti Aineistotyyppi

 

Aineiston alkuperä

Arvioitu tiedostokoko Tiedostomuoto Tallennuspaikat Omistaja(t) Metadata Voiko avata ja missä?

Aineisto sisältää henkilötietoja / on arkaluontoista/

sensitiivistä

1 Mass cytometry produced for the project 1 GB

.fcs / .csv

Seafile UTU readme yes (specify repository) No
2 Lab notes produced during the project < 10 MB .docx, .pdf, .txt Electronic lab notebook UTU / PI program generates no No
3

Interview transcripts 

produced for the project < 6 MB .txt Seafile (encrypted) UTU  readme, DDI yes, Finnish Social Science Data Archive No, anonymised
4 Interview recordings produced for the project < 5 GB .mp4 Seafile (encrypted) UTU readme, DDI no
yes, identified personal information
5  

Vihreällä merkityissä sarakkeissa olevat tiedot Akatemia vaatii, keltaisella olevien tietojen lisääminen 1.1. kohdan taulukkoon helpottaa koko DMP:n täyttämistä. 

Kuvaa, miten aineisto pidetään laadukkaana ja virheettömänä. Tutkimusaineistonhallinnassa laadulla tarkoitetaan teknisiä ja ulkoisia tekijöitä, jotka voivat liittyä esimerkiksi aineiston tallentamiseen, siirtämiseen tai konvertoimiseen.

Kerro, miten tutkimuksessa tai tutkimusryhmässä huolehditaan esimerkiksi

  • yhteisistä käytännöistä, joilla vältetään erilaisista kirjaus- ja analyysitavoista johtuvat virheet
  • määritellään versionhallintaprosessit: onko käytössä nimeämiskäytäntöjä tai git-alusta?
  • litteroinnin tarkistusprosessi
  • miten tietosisällön säilyminen varmistetaan, kun tietoja jaetaan?

Esimerkkilauseita, joita voi muokata oman aineiston mukaisiksi

  • Our research group/I have established common procedures to ensure data integrity, minimizing errors arising from inconsistent recording and analysis methods. We/I only use standardized protocols and formats.
  • Our research consortium/I promote(s) the use of standardized procedures for data management and analysis to foster consistency and accuracy across all studies, thereby reducing the potential for errors resulting from differing methodologies.
  • Our research group/I employ(s) version control processes, utilizing Git as the platform of choice, along with standardized naming conventions, to ensure traceability and minimize errors in code development.