Onko generatiivinen tekoäly kopiota?

Kirjoittanut: Markus Sjöberg

Generatiivinen tekoäly herättää usein kysymyksiä siitä, onko sen tuottama sisältö luonteeltaan pelkkää kopiota. Tekoälymallejahan koulutetaan suurilla datamassoilla ja toisaalta tiedetään, että mallit eivät ole aidosti luovia, vaan vain tilastomatemaattisia malleja. Generatiivinen tekoäly ei kuitenkaan kopioi, mutta sen tuottama materiaali perustuu suureen määrään olemassa olevaa dataa, josta se on oppinut (esim. Goodfellow ym. 2016).

Tämä oppimisprosessi tapahtuu esimerkiksi laajojen teksti- kuva- tai ääniaineistojen analysoinnin kautta, jolloin tekoälymalli tunnistaa malleja, joita se voi käyttää uusien sisältöjen luomiseen. Tekoälymalliin ei siis säilötä kaikkia opetusaineistossa ollutta sisältöä, vaan malli oppii aineistosta esimerkiksi eri väristen pikselien välisiä yhteyksiä, siis tietyllä tavalla vaikkapa omenalle tyypillistä muotokieltä. 

Filosofi Platonin tunnettu ideaoppi tarjoaa oivallisen analogian ymmärtääksemme, miten generatiivinen tekoäly toimii. Platon ajatteli, että todellinen tieto perustuu muuttumattomiin ja täydellisiin ideoihin tai muotoihin, jotka ovat aineellisen maailman yläpuolella ideamaailmassa. Maan päällä havaitsemamme konkreettiset esineet ja ilmiöt ovat ideaopin mukaan vain näiden täydellisten ideoiden epätäydellisiä heijastuksia tai kopioita. (Platon 1981. Lisää ideaopista esim. Wikipedia-artikkelissa) Samalla tavoin tekoälymalli oppii valtavista tietoaineistoista abstrakteja malleja ja periaatteita, siis ikään kuin ”ideoita”, joita se sitten käyttää uusien sisältöjen luomiseen. Se ei tallenna tai toista suoraan yksittäisiä esimerkkejä opetusaineistosta, vaan sisäistää yleiset ominaisuudet ja rakenteet, jotka määrittävät tietyn käsitteen tai objektin. Kun tekoäly esimerkiksi oppii, miltä omenat yleensä näyttävät, se omaksuu käsityksen esimerkiksi omenan ideasta kaikkien oppimiensa esimerkkien perusteella. Kun tekoäly generoi uuden kuvan omenasta, se ei kopioi mitään tiettyä opetusdatassa ollutta omenaa, vaan luo uuden ilmentymän omenan ideasta, joka on nyt osa sen sisäistä mallia.

Kuvia luova tekoälymalli ei kuitenkaan omenan ideasta huolimatta tulosta ideaaliomenan kuvaa aina sellaisenaan, kun siltä esimerkiksi pyytää kuvan omenasta. Omenan idea on pikemminkin omenuuteen liittyviä muotojen ja värien kokonaisuutta, jonka osaset liittyvät tietyllä todennäköisyydellä toisiinsa. Se ikään kuin ”ymmärtää” omenuuden eri vivahteita, kuten mahdollisia värivariaatioita vihreästä punaiseen ja keltaiseen sekä erilaisia muotoja, kiiltoja ja sijainteja suhteessa kuvan muihin elementteihin. Sama pätee myös multimodaalisiin kielimalleihin, jotka yhdistelevät omenan ideaan sanat omena, apple, äpple, sanoihin yhdistyvät äänteet eri äänenpainoineen sekä omenaan liittyvät kuvalliset ulottuvuudet.