Kirjoittaja: Lauri Järvilehto
Generatiivisen tekoälyn läpimurto on herättänyt monia kysymyksiä siitä, kenelle kuuluu oikeus ansaita luovan työn tuloksilla ja hallita niitä – esimerkiksi kirjoituksilla, kuvilla ja musiikilla. Yhtäältä kysymys siitä, kuka omistaa tekoälyn tuottaman sisällön on yhä pitkälti auki. Toisaalta auki on myös mittava määrä eettisiä ja juridisia kysymyksiä siitä, kenen töitä saa käyttää tekoälyn kouluttamiseen ja millä ehdoilla.
Kuka omistaa tekoälyn tuotannon?
Tekoälyn tuottaman sisällön osalta on nyt tehty kaksi tärkeää ennakkopäätöstä. Harmi vain, että ne ovat täysin vastakkaiset. USA:n tekijänoikeustoimisto linjasi alkuvuodesta 2025, että tekoälyn tuottamalla sisällöllä ei ole tekijänoikeutta. Jos siis olisin esimerkiksi generoinut tämän tekstin tekoälyllä, kuka vaan voisi ottaa siitä osia ja julkaista niitä omissa nimissään. Kiinalaiset oikeusistuimet ovat sen sijaan linjanneet, että tekoälyn käyttäjälle syntyy tekijänoikeus tuotokseen. EU seuraa tällä hetkellä amerikkalaista käytäntöä.
Tekoälyn tuottamaan sisältöön voi kuitenkin syntyä tekijänoikeus muunteluoikeuden kautta. Jos siis luova tekijä muokkaa työtä riittävästi, siihen syntyy tekijänoikeus. Mitä ”riittävästi” tarkoittaa ratkaistaan viime kädessä oikeusistuimen toimesta, jos asiasta syntyy riita. Tekoälyä voi siis käyttää sekä tekijänoikeusvapaan sisällön luomiseen että työkaluna tekijänoikeudella suojatun sisällön luomisen osana.
Yksi kinkkinen kysymys tekoälyn luomusten tekijänoikeuden tiimoilta on myös se, voiko tyylin suojata tekoälyllä. Esimerkiksi taannoin vallinnut Hayao Miyazaki -tyyppisten kuvien villitys herättää kysymyksen siitä, tulisiko Miyazakin pystyä suojaamaan teostensa tyyli, koska se on niin tunnistettava, että sitä on tekoälyllä mahdollista jäljitellä. Tämä ei ainakaan toistaiseksi ole mahdollista, mutta keskustelua asiasta käydään varmasti lähitulevaisuudessa.
Saako tekoälyä kouluttaa tekijänoikeuden alaisella materiaalilla?
Kysymys tekoälyn koulutuksesta on vielä mutkikkaampi. Tästä syystä käynnissä on lukuisia oikeusjuttuja, joissa taiteilijat pyrkivät saamaan korvauksia teostensa käytöstä tekoälyn kouluttamiseen. Tämä on kuitenkin ongelmallista ainakin kahdesta syystä. Ensimmäinen on taloudellinen, toinen eettis-teknologinen.
Taloudellinen kysymys teosten käytön korvaamisesta tekoälyn kouluttamiseen palautuu siihen, mikä osa tekoälyn tuotoista katsotaan korvaukseksi tekijöille ja miten korvausosuudet tilitetään. Samantapainen ongelma oli viitisentoista vuotta sitten musiikkiteollisuudessa, kun streaming-palvelut yleistyivät. Se ratkaistiin lopulta tilittämällä oikeudenomistajille korvauksia eräänlaisen painotetun pro rata -järjestelmän mukaan perustuen siihen, kuinka kukin kappale soi.
Tämä menetelmä ei kuitenkaan sovi tekoälyn käyttöön. Syitä on kaksi. Ensimmäinen on, että tekoälyn koulutus vaatii niin järjettömän määrän materiaalia, että pro rata -tilitys johtaisi muutamien senttien korvauksiin taiteilijaan kohti. Esimerkiksi kuvanluonnin tekoälypioneeri Stable Diffusionin luoneen Stability AI:n liikevaihto on ollut parhaimmillaan noin 44 miljoonan euron luokkaa. Järjestelmän ensiversiota koulutettiin 2.3 miljardilla kuvalla. Vaikka siis firman koko liikevaihto tilitettäisiin kuvat luoneille taiteilijoille, jäisi kullekin käpälään alle 2 senttiä vuodessa per kuva. Ja vaikka markkinajohtaja OpenAI tilittäisi koko 3,7 miljardin euron liikevaihtonsa oikeudenomistajille, jäisi siitäkin käteen vain 1,6 € vuodessa per kuva. Tosin OpenAI:n harjoitusdatan määrä on luultavasti kertaluokkaa tai kahta Stable Diffusionia suurempi, joten
korvaussummaa pitäisi korjata sen verran alaspäin. Ja tietenkään yksikään tekoälyfirma ei voi tilittää koko liikevaihtoaan, koska sen jälkeen firmaa ei enää ole.
Toinen ongelma pro rata -malliin on, että toisin kuin Spotifyllä, joka voi katsoa suoraan analytiikastaan, kuinka monta kertaa kukin kappale on soinut, tekoälyt eivät toimi näin. Tästä päästäänkin tekoälyn kouluttamisen eettis-teknologiseen tekijänoikeuskysymykseen.
Miten tekoäly oikeasti oppii?
Mediassa esiintyy yhä huuhaaväitteitä siitä, että tekoälyt etsivät ja käyttävät tekijänoikeuden alaisia teoksia. Virhepäätelmä syntyy siitä, että ihmiset vertaavat mielessään helposti tekoälyä Googleen tai Spotifyyn. Kyse on kuitenkin täysin erilaisesta teknologiasta. Itse asiassa yhdelläkään tekoälyratkaisulla ei ole mitään pääsyä harjoitusaineistoonsa – sen enempää kuin ihmiselläkään on kaikkiin kokemuksiinsa.
Sen sijaan tekoäly koulutetaan luomalla tilastolliseen yleisyyteen perustuva koneoppimisalgoritmi, joka pystyy oppimansa perusteella luomaan sisältöä sen mukaan millä aineistolla se on koulutettu – tekstillä, kuvilla, videolla tai äänellä. Tietyssä mielessä tekoälyn koulutusprosessi on siis hyvin samanlainen kuin ihmisen oppiminenkin.
Yksikään taiteilijanero ei ole putkahtanut maailmaan pensseli hyppysissään ja todennut äidilleen: ”Pistäpä tänne kanvaasi niin tempaisen mestariteoksen.” Luovuus edellyttää laaja-alaista altistumista taiteelle – eli sille, mitä muut ovat tehneet aiemmin. Toisin sanoen, tekoälyn oppiminen on rinnastettavissa siihen, kun ihminen käyskentelee taidegalleriassa tai lukee lempiteostaan.
Lopuksi
Uudet tekoälyteknologiat haastavat mittavassa määrin luovia aloja. On mahdollista, että jopa vallitsevat tekijänoikeuskäytännöt tulevat muuttumaan tämän johdosta. Yllä linjatut kysymykset ovat eettisesti mutkikkaita, eikä niihin ole yhtä yksiselitteisiä ratkaisuja. Viime kädessä ratkaisut tekevät ensi sijassa oikeusistuimet, ja pitkällä tähtäimellä lainsäätäjät.
Toivottavasti lopputulema mahdollistaa kuitenkin mahdollisimman monenlaisten luovan ilmaisun muotojen yhteiselon rinta rinnan. Parhaassa tapauksessa tekoäly on aivan uudenlainen työkalu itseilmaisuun, jolla oman taiteellisen ilmaisun rajaa voi viedä paljon kauemmaksi kuin koskaan aiemmin.