Uncanny Valley tekoälyn generoimien videoiden ja valokuvien luomisessa

Kirjoittanut: Markus Sjöberg

0:00 / 0:00

Tekoälyn kehitys on mahdollistanut hyperrealististen kuvien ja videoiden luomisen, jotka ovat hämmästyttävän tarkkoja ja yksityiskohtaisia. Tästä huolimatta monet tekoälyn tuottamat ihmishahmot ja kasvot herättävät katsojissa ristiriitaisia tunteita tai jopa epämukavuutta. Ilmiötä kutsutaan nimellä Uncanny Valley (suomeksi ”outouden laakso”), ja sen ymmärtäminen on keskeistä tekoälypohjaisten visuaalisten sisältöjen luomisessa. Tässä luvussa tarkastellaan Uncanny Valley -ilmiötä ja sitä, miten se vaikuttaa tekoälyn generoimien videoiden ja valokuvien suunnitteluun ja toteutukseen.

Uncanny Valley on käsite, jonka esitti alun perin japanilainen robotiikan tutkija Masahiro Mori vuonna 1970. Mori havaitsi, että kun robottien ja animoitujen hahmojen ulkonäkö muuttui yhä inhimillisemmäksi, katsojien empatia ja myönteinen suhtautuminen niihin kasvoivat. Kuitenkin tietyn pisteen jälkeen, kun hahmot olivat lähes ihmisen kaltaisia mutta eivät täysin autenttisia, katsojat alkoivat kokea epämukavuutta ja jopa vastenmielisyyttä. Tämä tunne voimistui sitä enemmän, mitä lähempänä hahmon ulkonäkö oli ihmistä olematta kuitenkaan täysin aidon näköinen. (Mori, 1970.)

Ilmiön taustalla on useita psykologisia ja kognitiivisia tekijöitä. Yksi keskeinen tekijä on kognitiivinen dissonanssi, joka syntyy, kun aivot havaitsevat ristiriidan hahmon inhimillisten piirteiden ja niiden epäluonnollisen ilmentymisen välillä. Toisin sanoen, kun hahmo näyttää lähes ihmiseltä mutta jokin sen ulkonäössä tai liikkeissä on ”väärin”, aivot reagoivat negatiivisesti. Tämä voi johtua esimerkiksi epäsymmetriasta kasvonpiirteissä, epäinhimillisestä silmien liikkeestä tai ilmeiden puutteesta, jotka kaikki vaikuttavat katsojan tunnekokemukseen. Ilmiön syyksi on esitetty erilaisia hypoteeseja esimerkiksi siitä, että ihminen tunnistaa robottikasvot sairaiksi tai siitä, että ihmiselle syntyy epävarmuustila siitä, onko kyse kone vai ihminen. (MacDorman & Ishiguro, 2006.)

Uncanny Valley ja tekoälyn luomat kuvat sekä videot

Robotiikan lisäksi ilmiö on mukana erilaisissa ihmisen kaltaisissa kuvissa. Tekoälyn luomat ihmishahmot ja kasvot ovat erityisen alttiita Uncanny Valley -ilmiölle. Vaikka tekoäly pystyy luomaan hyvin realistisia ja yksityiskohtaisia kuvia, se ei aina onnistu täysin jäljittelemään inhimillisiä piirteitä ja ilmeitä niin, että ne tuntuisivat katsojasta luonnollisilta. Tästä hyvänä esimerkkinä ovat esimerkiksi tekoälymallien alkuaikoina tyypilliset sormien liiallinen lukumäärä, poikkeuksellisen pitkät raajat tai jotkut muut epäluonnollisilta tuntuvat yksityiskohdat. Katsoja ei välttämättä osaa sanoa, mikä kuvassa on pielessä, mutta huomaa sen silti siten, että kuva tuntuu vastenmieliseltä.

. Vaikka kuvassa tai videossa saattaa olla teknisesti kaikki oikeat elementit—kuten valaistus, varjostus ja tekstuurit— pienet epätäydellisyydet voivat silti saada katsojan kokemaan hahmot epäilyttävinä tai pelottavina. Esimerkiksi tekoälyn luoma katse voi näyttää elottomalta tai kasvojen ilmeet saattavat olla liian jäykkiä. Nämä tekijät voivat aiheuttaa katsojalle epämiellyttävän tunteen, vaikka hahmon ulkonäkö olisi lähellä inhimillisyyttä. Olet varmaankin törmännyt joskus tekoälyllä luotuihin mainoskuviin, jotka ovat hyvin etäännyttäviä. Tällöin kyse saattaa olla juuri Uncanny Valley -ilmiöstä.

On olemassa useita strategioita, joilla voidaan vähentää ilmiön vaikutuksia ja luoda katsojille miellyttävämpi kokemus.

Tyylitellyt hahmot: Yksi strategia on välttää liian realististen ihmishahmojen luomista ja sen sijaan keskittyä tyyliteltyihin tai karikatyyrimäisiin hahmoihin. Kun hahmo on selvästi keinotekoinen, katsoja ei odota sen olevan täysin inhimillinen, mikä vähentää epämukavuuden riskiä. Tekoälyllä tehdyissä kuvitusmaisissa kuvissa ei siis ole suoranaista Uncanny Valley -tunnetta.
Sisällön valinta: Kun käytetyn mallin heikkoudet tuntee, voi sisällön suunnitella siten, etteivät epäluonnolliset ilmiöt tule vahvasti esille. Esimerkiksi hahmot voivat esiintyä siluettina tai kasvot käännettynä. Kuvituksissa voi suosia yksityiskohtia esineistä, joiden takana ihmiset ovat epäterävyysalueen ulopuolella.
Erikoistuneiden mallien yhteiskäyttö:Yksi strategia on panostaa tekoälyn kykyyn jäljitellä inhimillisiä piirteitä ja liikkeitä entistä tarkemmin. On siis mahdollista käyttää mallia, joka on tarkoitettu juuri siihen sisältöön, jota olet tekemässä. Kuvageneraattoreissa oli pari vuotta sitten tyypillistä käyttää eri mallia käsien tekemiseen.
Todellisuuden yhdistäminen: Neljäs lähestymistapa on käyttää tekoälyä työkaluna ihmisen luoman materiaalin parantamiseen sen sijaan, että hahmot luotaisiin kokonaan tekoälyn avulla. Tekoälyä voidaan hyödyntää esimerkiksi tekstuurien lisäämisessä tai valaistuksen optimoinnissa, kun taas hahmojen perusilmeet ja liikkeet luodaan perinteisin menetelmin.

Vaikka kuva- ja videomallit kehittyvät nopeasti, Uncanny Valley -ilmiö tulee todennäköisesti säilymään merkittävänä haasteena tekoälyn kehityksessä ja sen soveltamisessa visuaaliseen kulttuuriin. Täysin realististen ja luonnollisten inhimillisten hahmojen luominen on edelleen haastavaa. Kuvissa lopputulos voi jo toisinaan olla yllättävän hyvä, mutta etenkin videossa epäluonnollinen liike voi paljastaa sen keinotekoisuuden.

On kuitenkin todennäköistä, että tekoälyyn perustuvat menetelmät paranevat ja uudet algoritmit pystyvät vähentämään Uncanny Valley -ilmiön vaikutuksia. Toistaiseksi luovan alan tekijän kannattaa kuitenkin olla tietoinen sen negatiivisista vaikutuksista ja pyrkiä välttämään epätarkoituksenmukaisia outouden laakson aiheuttamia negatiivisia tunnetiloja. Joskushan sitä voi käyttää myös tehokeinona.