Siirry pääsisältöön
Turun yliopiston kirjasto

Kirjaston tekoälyopas

Tekoälyn käyttö yliopiston kirjaston näkökulmasta.

Tekoäly? Vaiko kielimalli?

Tekoäly nousi taas kaikkien huulille viimeistään ChatGPT:n julkaisun myötä. Mutta mikä on tämä tekoäly, joka näyttää ymmärtävän mitä tahansa, osaavan vastata kuten ihminen ja auttaa meitä esimerkiksi päivittäisessä asiantuntijatyössä?

ChatGPT:n kaltaisen tekoälyn taustalla on neuroverkkoja muodostavat algoritmit, niin sanotut generatiiviset tilastolliset mallit. Näitä malleja hyödyntämällä useat tekoälysovellukset muuttavat parhaillaan tapoja, joilla teemme työtämme, luomme uutta ja jaamme tietoa. Esimerkiksi Microsoft Copilot ja ChatGPT pohjautuvat OpenAI:n kehittämään GPT-4 -algoritmiin (Generative Pretrained Transformer).

Kaupallisten ja suljettujen isojen kielimallien sekä sovellusten ohella tarjolla on myös useita avoimia malleja. Tällaiset ovat ladattavissa käyttäjän omalle alustalle ja niiden jatkokouluttaminenkin omalla datalla on mahdollista, mikäli käytettävissä olevan henkilökohtaisen tietokoneen tehot riittävät tai käyttäjällä on muuten pääsy riittävään laskenta- ja tallennuskapasiteettiin esimerkiksi pilvipalveluiden kautta.

Yksi tehokkaimmista ja käytetyimmistä avoimista malleista on Meta AI:n kehittämä LLaMA. Uusia malleja julkaistaan lähes päivittäin, mutta mainittakoon tässä ainakin Hugging Facen ja BigScience-projektin yhteistyössä kehittämä BLOOM, TII:n Falcon sekä EleutherAI:n avoimen lähdekoodin malli GPT-J.

On kuitenkin tärkeää muistaa, että nämä tekoälysovellukset ovat vain työkaluja, tukiälyjä, eivät itsenäisiä toimijoita eivätkä ne ole suinkaan erehtymättömiä eikä niiden käyttö ole ongelmatonta. Onkin hyvä tietää jotain myös mallien toiminnasta.

Miten generatiivinen tekoäly toimii

Mikä kielimalli?

Massiivinen kielimalli, kuten esimerkiksi GPT-algoritmi, on koneoppimismalli, joka on koulutettu ymmärtämään ja tuottamaan kieltä. Se lukee, kuuntelee sekä vastaa sujuvasti lähes kaikilla luonnollisilla kielillä ja osaa myös esimerkiksi useita ohjelmointikieliä.

Mitä se on syönyt?

Generatiivisten algoritmien koulutus toteutetaan valtaisalla määrällä digitaalisessa muodossa olevaa dataa. Kielimallin kyseessä ollen oppimisprosessissa malli on käynyt läpi ja opiskellut suunnattoman määrän kirjoitettua tekstiä. Tällä hetkellä laajimman käytössä olevan mallin (GPT-4) kohdalla puhutaan käytännössä koko internetin sisällöstä.

Miten kielimalli ymmärtää ja osaa vastata?

ChatGPT:n ja Copilotin taustalla oleva GPT-kielimalli ennustaa todennäköisyyksien avulla seuraavien sanojen sekä lauseiden sisällön ja rakenteen. Malli on sisäistänyt miljoonia tekstejä, oppien kielten rakenteet, kieliopin säännöt ja samalla myös tekstien sisältämän informaation. Tekoälyä ei ole ohjelmoitu toimimaan tietyllä tavalla, eikä sillä ole erillistä tietokantaa, vaan sen “äly” perustuu sen itse oppiessaan rakentamaan neuroverkkoon. Tässä mielessä vertaus mallin toiminnassa ihmisaivoihin ei ole hirveän kaukaa haettu.

Vaikka tekoäly kykenee tuottamaan hyvin ihmismäistä tekstiä, sen “ymmärrys” perustuu tilastollisiin malleihin, ei aidolle ymmärrykselle tai tietoisuudelle.

Kielimalli ei ymmärrä kieltä samalla tavalla kuin ihminen:

  • Ei aitoa kontekstuaalista ymmärrystä: tekoäly ei ymmärrä aiheita syvällisesti.
  • Ei emotionaalista ymmärrystä: tekoäly voi simuloida tunteita, mutta ei tunne niitä.
  • Tilastollinen eikä looginen ymmärrys: kielimallin ymmärrys perustuu sanojen ja niiden muotojen esiintymistiheyksiin.
  • Ei itsetietoisuutta tai intentiota: tekoäly ei tiedosta itseään eikä sillä ole omaa tahtoa.
  • Rajoitettu konteksti: kielimallilla ei ole pitkän aikavälin muistia eikä se ymmärrä laajempia keskusteluhistorioita.

Massiivisten tekoälymallien koulutuksessa on haasteita

  • Relevantin koulutusmateriaalin löytäminen: Riittävän, relevantin ja kaikin puolin käyttökelpoisen datan löytäminen on yksi suurimmista haasteista uusia ja entistä laajempia tai spesifimpiä malleja luotaessa. Jos mallin oppima data on jollain tavalla vääristynyttä (bias), on sitä hyvin suurella todennäköisyydellä myös mallin antamat vastaukset.
  • Laskentateho: generatiivisten mallien kouluttaminen vaatii huomattavaa laskentatehoa, mikä edellyttää yhä tehokkaampia supertietokoneita (GPU- tai TPU-laitteistoja).
  • Energiankulutus: Suuret mallit kuluttavat sekä toimiessaan että niitä koulutettaessa todella paljon sähköenergiaa ja näin ollen mallien käytöllä on myös merkittäviä ympäristövaikutuksia.
  • Mallin hienosäätö ja mahdolliset vääristymät: Toimiakseen tarkoituksenmukaisesti generatiivisten mallien parametrit edellyttävät hienosäätöä ja testausta. Koska mallit ovat eräänlaisia “mustia laatikoita”, parametrien säätäminen ja mallin opettaminen voi vaatia linjauksia, jotka voivat vääristää arvaamattomasti mallin päätelmiä. Hienosäätö käyttäjäystävällisyyden lisäämiseksi tai moraalisesti hyväksyttävämpien vastausten saavuttamiseksi voi esimerkiksi synnyttää ennakoimattomia vääristymiä mallin vastauksiin.

Mitä tukiälysovellusta käyttäisin?

Microsoft Copilot

Turun yliopiston opiskelijoilla ja henkilökunnalla on käytössään Microsoft Copilot, joka on osa yliopiston Microsoft 365 -lisenssiä. Copilot toimii suojatussa tilassa, jolloin sille syötettyjä tietoja ei tallenneta eikä käytetä tekoälyn kouluttamiseen. Se käyttää OpenAI:n GPT-4-kielimallia ja DALL·E 3 -malliin perustuvaa Designer Image Creatoria kuvien luonnissa. Copilotissa on kolme keskustelutyyliä:

  • Luovempi (Creative): Tuottaa luovia vastauksia, kuten runoja ja tarinoita.
  • Tasapainoisempi (Balanced): Pyrkii tuottamaan tasapainoisia ja informatiivisia vastauksia.
  • Tarkempi (Precise): Keskittyy tarkkoihin ja yksityiskohtaisiin vastauksiin.

Copilotin käyttöön tarvitaan Turun yliopiston tunnukset, ja se toimii parhaiten Microsoft Edge -selaimella.

ChatGPT

ChatGPT on OpenAI:n kehittämä luonnollisen kielen chatbotti, joka hyödyntää GPT-algoritmiperhettä. Se on hienosäädetty erityisesti vuorovaikutteista keskustelua varten ja käyttää erityisen laajaa kielellistä aineistoa. ChatGPT osaa myös tulkita kuvallista informaatiota ja tuottaa DALL-E:n avulla kuvia. Perusversio ChatGPT:stä on ilmainen käyttää, mutta vaatii rekisteröitymisen.

Keskeiset erot Copilotiin verrattaessa Turun yliopiston näkökulmasta:

  • Tietosuoja: ChatGPT:n maksuttomassa versiossa käyttäjän sille syöttämiä tietoja sekä tiedostoja voidaan käyttää esimerkiksi mallin kouluttamiseen, kun taas Copilotin tiedot pysyvät organisaation sisällä.
  • Eettisyys: Copilot tarjoaa paremman suojan tekijänoikeudellisille ja arkaluonteisille tiedoille, mikä tekee siitä eettisemmän vaihtoehdon organisaatiokäyttöön.

GitHub Copilot

GitHub Copilot on suunniteltu erityisesti ohjelmoijille. Se toimii koodin täydennystyökaluna, joka tarjoaa reaaliaikaisia koodiehdotuksia ja täydentää koodirivejä automaattisesti. Se käyttää OpenAI:n Codex-mallia ja tukee useita ohjelmointikieliä ja -kehyksiä. GitHub Copilot oppii käyttäjän koodausmalleista ja mukauttaa ehdotuksiaan ajan myötä.

(Päivitetty 30.8.2024)

Podcast: ChatGPT - mikä se on?

ChatGPT – mikä se on?

Anu: ”Tekoäly on tietokonejärjestelmien kyky suorittaa tehtäviä, jotka vaativat ihmisen älykkyyttä, kuten oppimista, päätöksentekoa ja kielen ymmärtämistä. Se voi olla heikko, erikoistunut yhteen tehtävään, tai vahva, kykenevä useisiin erilaisiin tehtäviin ja oppimaan itsenäisesti. Tekoälyä hyödynnetään monilla aloilla parantamaan prosesseja, palveluiden laatua ja ratkaisemaan monimutkaisia ongelmia.”

Näin tekoälysovellus ChatGPT vastasi kun kysyin siltä mitä tekoäly on. Mutta voiko tähän vastaukseen luottaa? Ja miten ChatGPT oikein toimii? Kysytäänpä asiaa kirjaston palvelupäällikkö Antti Peltoselta, joka on seurannut jo pitkään tekoälyn kehitystä. Antti, kerrotko miten ChatGPT toimii?

Antti: Joo, hei vaan. ChatGPT on tosiaan tällainen generatiivinen malli, käyttää generatiivista tekoälyalgoritmia. Ja se toimii niin että se on opiskellut kaiken mitä sille on annettu ja sen jälkeen se koittaa arvailla minkälaisia vastauksia se tuottaa, eli se oppii, opiskelee mitä sille opetetaan – kieltä,  kuten nyt ChatGPT:n kohdalla. Sillä on valtava määrä digitaalista dataa, ja sen jälkeen se muodostaa siitä neuroverkon, josta se katsoo millä lailla esimerkiksi lauseessa tai siinä rakenteessa se informaatio on rakentunut. Ja kun siltä pyydetään, se rupeaa tuottamaa samantapaista ja samantyylistä tekstiä, nyt niin kuin ChatGPT:n kohdalla, niin se tuottaa tekstiä.

Anu: Mutta voiko sen vastauksiin luottaa, ymmärtääkö se mitä se meille vastaa?

Antti: Tämä on hyvä kysymys koska siitä ei voida aivan varmasti sanoa ymmärtääkö se, mutta suuri konsensus on sitä mieltä, että se ei ymmärrä. Täytyy tietysti miettiä mitä ymmärtäminen oikeastaan on, mutta voitaisiin ainakin sanoa, että se ei ymmärrä sitä sillä tavoin kuin ihminen. Koska kyseessä on neuroverkko, tai sentyyppinen algoritmi joka on muodostanut neuroverkon, niin se on hyvin ihmismäinen tai samantyyppinen kuin sanotaanko biologiset aivot. Eli kysymys siitä voiko siihen luottaa: siihen voi samalla tavalla luottaa kuin jos sulla on kaveri joka on kaikista paras kaikissa pubivisoissa ja tietää ihan kaiken ja jos mietit että lähdetään johonkin tietokilpailuun niin tämän kaverin otan mukaan sinne, mutta et sitten kuitenkaan kysy häneltä – tai jos hän on lääkäri niin voit kysyä – mutta et kuitenkaan kysyisi häneltä diagnoosia siihen mikä sun varpaassa on vikana. Hän voi antaa siihen oikein hyvän vastauksen ja täysin pätevän vastauksen mutta luottaisiko siihen samalla tavalla kuin jos oikea asiantuntija olisi sen antanut. Toki tässä ChatGPT:n kohdalla on se että pubivisanero on potenssiin kymmenen eli siinä käytännössä on tällaisia asiantuntijoita yhdistettynä eli koska tää GPT-algoritmi on oppinut ja opiskellut ja sitä on opetettu vastaamaan oikein ihan ihmistenkin toimesta eli sitä on koulutettu, niin ne on keskimäärin hyviä ja luotettavia vastauksia mutta ei aina.

Anu: Eli ei voi ulkoistaa ajattelua ja oppimista ja opiskelua ChatGPT:lle vielä?

Antti: No ei, tai voi sen tehdä, mutta ei siinä välttämättä ole kauhean täydellinen lopputulos. Tokihan noita on maailmalla nimenomaan GPT-algoritmille ja muillekin GPT-algoritmiin perustuville algoritmeille erilaisia loppukokeita ja testejä syötetty ja ne pärjää siinä vertautuen sellaista keskimääräistä ihmistasoa. Mutta tästä algoritmista käytetään tuolla maailmalla ja täällä Suomessakin nimeä että se joskus hallusinoi – mä en ehkä sanoisi hallusinoi, sillä on vähän tällaisia vapaita assosioita. Me ollaan totuttu siihen että koneet ja tietokoneet antaa täsmällisiä vastauksia niin meidän täytyy näiden algoritmien kohdalla muistaa se että se ei ole enää sellaista samanlaista – eli tämä algoritmi ei hae mitään tietoa netistä, se on opetellut sen ulkoa, se on lukuisia tuhansia miljoonia erilaisia lähteitä tietystä aiheesta  opiskellut ulkoa ja sitten se algoritmi muodostaa siitä vastauksen sen kysymyksen perusteella. Ja se on luonnollisen kielen kysymys mitä me sille annetaan joten siinä on tulkintaa ensin siihen suuntaan ja sen jälkeen se algoritmi lähtee tulkitsemaan miten hänen pitäisi vastata joten hän voi tehdä tällaisen tulkintavirheen – jos  käytetään sanaa hän tästä algoritmista kuten minä huomaan vahingossa joskus käyttäväni – niin silloin me ollaan sellaisessa tilanteessa että siinä voi tulla semmoisia että tieto ei sinänsä ole virheellistä mutta se voi olla tarkoitettu toisentyyppiseen tarkoitukseen algoritmin mielestä kuin mikä meillä ehkä oli se alkuperäinen tarve.

Anu: Minkä takia nyt puhutaan niin paljon nimenomaan juuri ChatGPT:sta, se on varmaankin tunnetuin näistä tekoälysovelluksista, mutta minkä takia?

Antti: Joo se on nyt tässä oikeastaan viimeisen vuoden aikana ponnahtanut kaikkien näköpiiriin. Näitähän on totta kai kaikenlaisia tekoälysovelluksia, meillä on Sirit ja Google assistantit ja Amazonin Alexa ja kaikkia tällaisia joihin me ollaan jo tietyssä mielessä totuttu, eli me ollaan totuttu jo Googlen algoritmiin kun me haetaan ja se osaa tarjota meille juuri meille sopivaa oikeaa tietoa – onko se sitten meidän itsemme mielestä oikeaa ja onko se sitten hienoa että se tekee sitä niin personoidusti – mutta me ollaan totuttu näihin. Mutta tää GPT-algoritmi eli tällaista luonnollista kieltä erittäin luonnollisella tavalla ymmärtävä ja myös sitten tuottava algoritmi niin tämä oli vähän tämmöinen Graalin malja josta ajateltiin että se on vielä todella kaukana tulevaisuudessa. Ja se tietyllä tapaa vertautuu tällaisiin yleistekoälyihin eli GPT ja ChatGPT ei ehkä voida sanoa että se olis varsinainen yleistekoäly mutta se on hyvin lähellä. Eli se on tekoälyalgoritmi jota voidaan käyttää hyvin matalalla kynnyksellä, se on äärimmäisen toimiva, sen käyttö ei sinänsä vaadi mitään erityisosaamista ja tietysti siinä on se että OpenAI eli tämä ChatGPT:n kehittänyt firma – joka nimestään huolimatta ei ole avoin – niin on tarjonnut sen käyttöön. Ja meillähän on ollut kaiken maailman, muistelen lapsuudesta ja nuoruudesta kun oltiin Mikrobitin tilaajia niin siellä oli kaikenlaisia ohjelmakoodeja, siellä oli tällainen kotipsykiatri jonka etunimeä en nyt muista, mutta sen kanssa pyöriteltiin ja leikittiin veljen kanssa ja se pystyi vastaamaan tällaisia vähän niin kuin oikean kuuloisia vastauksia, kun siltä kyseli, eli sillä oli ohjelmoituna nää mutta siinä koko ajan tiesi että tää on nyt tätä ohjelmaa, että kun laittaa sille tällaisen kysymyksen niin se vastaa väärin ja kun laittaa tällaisen niin se vastaa näin. Mutta ChatGPT oikeasti tuottaa itse sitä tekstiä ja sen kanssa voi ihan oikeasti keskustella, joten se on aika iso askel eteenpäin siihen tekoälykehitykseen mitä tässä on viime vuosina menty.

Anu: Tää ChatGPT tallentaa ne kysymykset, sen tekstin jota sinne kirjoitetaan, pitäiskö tämä ottaa huomioon siinä kun sitä käyttää?

Antti: Kyllä se kannattaa. Eli tässähän on myös se puoli että mehän ei oikein tällä hetkellä osata välttämättä sanoa että mihin niitä käytetään niitä tekstejä, sehän on vaan mainittu siinä että ne tallennetaan ja sensitiivistä tietoa ei siellä kannattaisi käsitellä. Ja tää tulis muistaa myös siinä mielessä että hirveän moni muu tekoälysovellus hyödyntää tätä OpanAI:n rajapintaa ja tätä GPT-algoritmia ja varmasti niissä käyttöehdoissa joihin aina klikataan että kylläkylläkyllä sanotaan myös se että näitä käytetään sen algoritmin mahdolliseen jatkokoulutukseen ja viilailuun, ja silloin se tarkoittaa sitä, että kun me ollaan kirjautuneina siihen palveluun niin meidät pystytään periaatteessa yhdistämään niihin tietoihin. Ja OpenAI:ssakin Microsoft on isoin yksittäinen omistaja ja tämmöiset isot ohjelmointi- ja datafirmat, nehän käyttää tällaista tietoa kaikenmoisiin tarkoituksiin, joten kyllä siinä tietty varovaisuus kannattaa pitää mielessä.

Anu: Mainitsit tuossa sanan sensitiivinen tieto – voitko antaa esimerkkejä siitä mitä tietoja sinne nyt ei ainakaan kannattaisi laittaa?

Antti: Joo, tää on tietysti aika henkilökohtaista siinä mielessä että kuka mieltää onko sillä väliä pystytäänkö yhdistämään vaikka tiettyjä sairauksia suoraan itseensä, siis joku muu pystyy yhdistämään. Mutta esimerkiksi tällaiset terveystietoihin liittyvät tiedot eli kun kysellään että minulla on tuossa varpaassa tuommoinen patti ja mitäs tehdään niin täytyy muistaa että siellä konehuoneessa pystytään yhdistämään että se on nyt tällä Turun yliopiston kirjaston palvelupäällikkö Antti Peltosella se patti siinä varpaassa. Ja tästä sitten miettiä sitä eteenpäin että mitä kaikkea muuta kun sille syöttää niin mitä muuta tietoa se meistä saa. Mutta tietysti kaikki tällaiset henkilökohtaisiin salasanoihin liittyvät asiat tai muut mitä ei muutenkaan paljastaisi kenellekään uppo-oudolle henkilölle missään eikä välttämättä edes tutuille niin se kannattaa muistaa että ne menee sinne datakeskuksiin ja niitä käytetään sen algoritmin jatkokoulutukseen ja ehkä johonkin muuhunkin vielä.

Anu: Mihin kaikkeen olet itse sitten käyttänyt tätä ChatGPT:tä?

Antti: Joo, mä olen käyttänyt sitä tosi laajalti mutta viime aikoina se mun käyttö on keskittynyt siihen että olen hyödyntänyt tän algoritmin englannin kielen osaamista eli meillähän on kaiken maailman Google translatorit ja suurin osa meistä on englantia koulussa opiskellut ja varmasti taitotaso voi olla hyvinkin korkealla mutta  kun tässä ChatGPT:ssä suurin osa siitä treenausmateriaalista on ollut englanninkielistä ja siinä on ollut myös hyvin paljon englanninkielistä kirjallisuutta syötettynä ihan, sen huomaa kun lähtee siltä kyselemään. Niin mä olen käyttänyt sitä kielen jalostamiseen eli kirjoitan englanniksi asian ja pyydän sitä yhdistämään sitä johonkin toiseen tai pyydän että se katsoo että se virtaa se teksti sujuvasti tai miettimään erilaisia vaihtoehtoisia vastauksia ja se siinä hirveän hyvä. Silloin kun tietää itse sen asian mitä sinne kirjoittaa, jos ajattelee vaikka että on kirjoittamassa jotain tiettyä kirjallista tuotosta ja vähän epäilee sitä että mitenhän se kieliasu menee tai miten tästä saisi mielenkiintoisemman tai miten tästä saisi mukaansatempaavamman tai miten liittäisi tämän tietyn asian jonka tämän yksittäisen asian tiedän oikein hyvin mutta miten tästä voisi tehdä mielenkiintoisen niin siltä saa tosi nopeesti kun pyytää vaan että koitapa tehdä se näinpäin tai lisääpä siihen vähän  tätä tai kirjoita jonkun tietyn kirjailijan tyylillä tämä asia niin se osaa ja hallitsee ne todella hyvin. Sen tyyppisen mä olen käyttänyt sitä viime aikoina eniten.

Anu: No entäs sitten lopuksi, mitä meidän kaikkien pitäisi tietää ChatGPT:stä ja tekoälystä?

Antti: Tuo on äärimmäisen hyvä kysymys. Ehkä se mitä kannattaa pitää mielessä on se että tämä GPT-algoritmi ja muut algoritmit integroituu ihan kaikkeen eli maailmalla ja Suomessakin se suuri boomi on tällä hetkellä se että kaikkeen mahdolliseen, sellaiseen tuttuun, mikä on meille tuttua, eri sovellukset, ohjelmistot, autot, jääkaapit, pölynimurit, kaikki muut tällaiset niin ne integroituu siihen ja se tulee osaksi meidän arkea. Eli ehkä se mikä on hyvä pitää mielessä ja pitäisikin tajuta on se että maailma tulee muuttuman aika paljon tässä. Se että tuleeko se olemaan radikaali muutos vai onko se sellainen vähittäinen, mutta joka tapauksessa nää algoritmit ja GPT ja tän tyyppiset kieltä osaavat ja kuvaa tuottavat ja elokuvia tuottavat tulee olemaan osa arkea. Ja ehkä meidän pitää muistaa myös se kritiikki ja pieni skeptismikin siinä eli ihan lähitulevaisuudessa on äärimmäisen hankala tietää onko joku valukuva tai teksti tai videopätkäkään sitä meidän autenttista todellisuutta vai onko se kenties tehty tekoälyalgoritmilla.

Anu: Annetaan vielä ChatGPT:lle puheenvuoro: pyysin sitä yhdellä hauskalla lauseella kertomaan, mitä iloa tekoälystä on yliopisto-opiskeluissa, ja vastaus oli seuraava:

”Yliopisto-opiskelijan salainen ase on tekoäly, se on kuin uskollinen taikasieni, joka tarjoilee personoitua oppimista kimaltavalla jalustalla, hakee tietoa nopeammin kuin salama ja auttaa opettajia loihtimaan opetusta taianomaisella simsalabim-meiningillä!”