Siirry pääsisältöön
Turun yliopiston kirjasto

Kirjaston tekoälyopas

Tekoälyn käyttö yliopiston kirjaston näkökulmasta.

Käsitteitä

Tekoäly

  • Tekoälyllä tarkoitetaan tietokonejärjestelmien kykyä käsitellä tietoa ja suorittaa tehtäviä tavalla, joka muistuttaa ihmisen ajattelua. Tekoäly ei kuitenkaan "ymmärrä" asioita, vaan toimii tilastollisten mallien perusteella. Arkipäiväisiä esimerkkejä ovat esimerkiksi käännösohjelmat ja erilaisten suosittelulistojen taustalla toimivat järjestelmät.

Suuri kielimalli (LLM, Large Language Model)

  • Suuri kielimalli on tekoälyjärjestelmä, joka on opetettu valtavilla tekstiaineistoilla ennustamaan sanojen todennäköistä esiintymistä tekstissä ja joka kykenee tuottamaan, tiivistämään ja kääntämään tekstiä. Kielimalli ei hae tietoa ulkoisista lähteistä, vaan toimii koulutusaineiston datan pohjalta.

Koneoppiminen

  • Koneoppiminen on tekoälyn osa-alue. Koneoppimismenetelmissä tietokone oppii datasta sen sijaan että sille koodattaisiin erillisiä sääntöjä. Koneelle näytetään esimerkiksi kuvia kissoista ja koirista ja kone itse oppii erottelemaan ne.

Generatiivinen tekoäly (gen AI, GAI)

  • Tekoäly, joka pelkän luokittelun tai tunnistamisen sijaan osaa luoda uutta sisältöä (esim. tekstiä tai kuvia) oppimansa mallin perusteella. 

Hakuperustainen generointi  (Retrival Augmented Generation, RAG)

  • Retrieval-Augmented Generation (RAG) yhdistää perinteistä tiedonhakua ja generatiivista tekoälyä. Käyttäjän kysymys muutetaan ensin esimerkiksi tietyn tietokannan ymmärtämäksi hakulausekkeeksi jonka avulla etsitään relevantteja lähteitä. Tämän jälkeen tekoäly valitsee käytettävät lähteet ja muodostaa niiden pohjalta kielimallin avulla vastauksen.
  • RAG-haku ei perustu pelkästään siihen, mitä kielimalli on oppinut koulutusaineistostaan, vaan se on integroitu esimerkiksi tiettyyn tietokantaan ja käyttää nimenomaan sen sisältämää dataa vastauksissaan Myös RAG-pohjaiset järjestelmät voivat hallusinoida tai antaa vinoutuneita vastauksia. Vaikka vastauksessa hyödynnettäisiin luotettavia tieteellisiä lähteitä, malli voi tulkita niitä väärin tai muotoilla vastauksen tavalla, joka ei enää vastaa alkuperäistä sisältöä tai asiayhteyttä.

Hakulauseke ja prompti (syöte, kehote)

  • Perinteisessä tiedonhaussa käyttäjä muodostaa hakulausekkeen, jolla etsitään dokumentteja esimerkiksi tietokannoista. Hakutulokset perustuvat avainsanoihin ja hakualgoritmeihin, ja käyttäjä valitsee tuloksista tarpeitaan vastaavat lähteet.
  • Hakulauseke (search query, search string) on avainsanojen yhdistelmä, jolla haetaan tietoa tietokannasta tai hakukoneesta, esimerkiksi ”tekoäly AND oppiminen AND kielet”
  • Prompti (prompt) on kysymys tai ohje, joka annetaan tekoälylle ohjaamaan sen tuottamaa vastausta, esimerkiksi, ”kerro lyhyesti, miten tekoälyä voi käyttää oppimisen tukena kielten opiskelussa”
  • Hakulausekkeen ja promptin ero: hakulauseke hakee olemassa olevaa tietoa, prompti ohjaa tekoälyä tuottamaan uutta sisältöä

Hallusinointi ja vinoumat

  • Tekoälyn hallusinoinnilla tarkoitetaan sitä, että tekoäly antaa vääriä ja keksittyjä tietoja uskottavan oloisesti. Hallusinointia tapahtuu siksi, että tekoäly muodostaa vastauksia todennäköisyyksiin perustuen. Jos se ei löydä sopivaa faktaa, se voi täydentää aukon itse.
  • Vinoumilla tarkoitetaan tekoälyn vääristyneitä tai puolueellisia vastauksia. Vinoumat heijastavat tekoälyn koulutukseen käytetyssä datassa esiintyviä ennakkoluuloja ja epätasapainoa, esimerkiksi sukupuolistereotypioita tai englanninkielisen aineiston yliedustusta.

Avoin ja suljettu tekoäly-ympäristö

  • Avoimessa tekoäly-ympäristössä, esimerkiksi maksuttomassa ChatGPT:ssa, data kulkee tekoälypalveluntarjoajan palvelimille, mikä tekee käytöstä helppoa ja edullista, mutta tuo tietoturva- ja yksityisyysriskejä. 
  • Suljettussa tekoäly-ympäristössä, esimerkiksi yliopiston sisäisessä Copilotissa, data pysyy tietyn organisaation, esimerkiksi yliopiston, sisällä, mikä parantaa tietoturvaa ja hallintaa, mutta vaatii enemmän resursseja ja ylläpitoa.