Blog

  • Valmistaudu pettymään: generatiivisen videon vaihtelevat tulokset

    Valmistaudu pettymään: generatiivisen videon vaihtelevat tulokset

    Kuluva vuosi on tuonut generatiiviset videotyökalut kaikkien tietoisuuteen. OpenAI:n Sora-malli rikkoi alkuvuodesta jopa kansainvälisen uutiskynnyksen. Mallin puhuttiin yltävän elokuvan tasolle ja tuottavan niin hyviä videoita, ettei niitä erota enää todellisesta.

    Sora-mallia ei kuitenkaan vielä tähän syksyyn mennessä ole nähty julkisesti saatavilla. Sen sijaan moni muu malli on mennyt huimasti eteenpäin. Runway julkaisi uuden Gen-3 Alpha -mallinsa, Luma Labs Dream Machine -tekoälytyökalun ja kiinalainen Kling oman mallinsa. Vaikka nämä mallit eivät aivan ylläkään sille tasolle, jolla Sora-mallin kerrottiin alkuvuodesta olevan, ovat ne tehneet videoiden generoimisesta selvästi sujuvampaa ja lopputuloksista laadukkaampia.

    Alla on esimerkki Runwayn aikaisemmalla Gen-2 -mallilla tehdystä videosta, jossa Hugo Simbergin taulu Haavoittunut enkeli herää eloon:

    Lopputulos on kerrassaan huvittava. Ehkä erikoisuudessaan jollain tavalla taiteellinenkin. Gen-3 Alpha -malli sen sijaan teki liikkeestä jo kohtuullisen laadukasta:

    Kuitenkin myös tämä video on kaukana toimivasta. Poika ottaa mukaansa taustalla olevan pensaan, jalat sumentuvat, liike on välillä nykivää ja epätodellista, tausta muuttuu tyyliltään erilaiseksi. Tekemällä kymmeniä ja kymmeniä kehotteita ja odottamalla uusien videoiden tuotantoa voisi olla mahdollista saada jotain käyttökelpoista. Usein lopputulos ei tällöinkään ole riittävän laadukas, jos tarkoituksena ei ole demota tekoälyn käyttöä tai videon tehtävänä ei ole toimia tekoälyn visualisointina.

    Jos malleja ajatellaan ammattimaisen videotuotannon osana, ovat ne vielä kaukana toimivasta. Vaikka kehotteiden kirjoittaminen on sinänsä yksinkertaista, on jatkuva yrityksen ja erehdyksen kautta tapahtuva tekotapa ja epävarmuus lopputuloksesta sillä tasolla, ettei generatiivinen videontuotanto korvaa vielä perinteisiä keinoja, ei edes osittain. Mallit ovat myös edelleen suhteellisen kalliita. Niillä saa helposti kulumaan kymmeniä euroja, ilman että lopputuloksena syntyy mitään käyttökelpoista.

  • Tekoälytaidenäyttely ajatuksia herättämässä

    Tekoälytaidenäyttely ajatuksia herättämässä

    Kesäkuussa 2024 LuovAIn!-hanke näkyi Porin SuomiAreenan yhteydessä järjestetyssä SLASH!-tapahtumassa, missä se muun muassa piti tekoälyllä tehdyn demonäyttelyn. Näyttelyssä pääsi tutustumaan niin tekoälyn luomiin kuviin, videoihin kuin ääneenkin.

    Näyttelytilan katseenvangitsija oli taulu, jossa tekoälyn luomat elävät kuvat ja videot vaihtuivat klassikkomaalauksista suomalaiseen luontoon. Taulu oli kiinnitetty perinteiseen maalaustelineeseen. Hämärässä valaistuksessa tunnelmaa ylläpiti tekoälyn luoma musiikki ja puhe. Kuvien lisäksi taulusta näkyi muun muassa ”tekoälyuutiset”.

    Demonäyttely aktivoi vierailijoita mielenkiintoisilla tehtävillä. Jokainen sai itsenäisesti arvuutella, kumpi lähes identtisistä luontokuvista oli aito valokuva ja kumpi tekoälyn luoma. Tämän lisäksi katsojia haastoi ruudukko kasvokuvia, joiden seassa oli ainoastaan yksi oikea ihminen. Moni kertoi, että joutui tosissaan miettimään kuvien todenperäisyyttä ja saattoi silti arvata väärin.

    Tekoälylle syötettyjen kehotteiden takana oli Tampereen yliopiston tutkija Markus Sjöberg, jonka mukaan näyttelyn tarkoitus oli ennen kaikkea herättää ajatuksia. ”Tekoäly todellakin muuttaa koko luovan alan ekosysteemiä. Se ei välttämättä tarkoita sitä, että jokaisen tarvitsee tehdä tekoälytaidetta tai käyttää luovassa työssään tekoälyä, mutta jokaisen luovan alan tekijän täytyy hakea oma paikkansa suhteessa tekoälyn muuttamaan toimintakenttään”, hän sanoo.

    Hankkeessa toivotaan, etteivät ihmiset poissulkisi kokeilematta ajatusta tekoälystä, sillä se on jo nyt osa arkeamme ja parhaimmillaan loistava apuväline. Yksilötasolla olisi hyvä aktiivisesti miettiä ja hakea omaa paikkaa tekoälyn tuomassa muutoksessa. LuovAin! on ottanut tehtäväkseen auttaa löytämään se oma paikka.

    Sjöberg on pilotoinut erilaisia tekoälytyökaluja ja selvittänyt luovien alojen käytäntöjä sekä suhtautumista tekoälyyn. Hän on tehnyt projekteja, joiden aikana hän on käyttänyt tekoälyä konkreettisena apuvälineenä, joka ratkaisee käytännön ongelmia.

    ”Usein jos tekee vain teknologiademon, niin lopputulos voi näyttää hirveän hienolta ja saattaa vaikuttaa siltä, että tekoälytyökalu on kyvykkäämpi kuin se oikeasti onkaan. Sitten kun otetaan jokin käytännön ongelma ratkaistavaksi, huomataan ne rajat ja ettei se taivukkaan siihen”, Sjöberg kertoo.


    Teksti ja kuva: Marge Ollila

  • Tekoälyn sietämätön keveys

    Tekoälyn sietämätön keveys

    Tekoäly on kuin kaksiteräinen miekka – se tarjoaa loputtomia mahdollisuuksia, mutta herättää myös syviä eettisiä kysymyksiä. Tekoälyn keveys piilee sen kyvyssä käsitellä suuria tietomääriä ja tuottaa sisältöä nopeasti, mutta tämä keveys muuttuu sietämättömäksi, kun pohditaan tekoälyn tuottaman sisällön totuudenmukaisuutta ja vaikutusta yhteiskuntaan.

    Tekoälyyn liittyvät eettiset haasteet ovat moninaisia. Yksi keskeisimmistä on vastuu: kuka on vastuussa, kun tekoäly tekee virheen tai aiheuttaa vahinkoa? Toinen huolenaihe on yksityisyys: tekoäly voi kerätä ja analysoida henkilökohtaisia tietoja ilman käyttäjän suostumusta tai tietoisuutta. Lisäksi on syväväärennöksiä (deepfakes), jotka voivat luoda vakuuttavia valheellisia videoita tai äänitteitä, joilla voi olla vakavia seurauksia demokratialle ja yksilöiden maineelle.

    Syvien väärennösten jäljillä

    Syväväärennökset ovat tekoälyn ja koneoppimisen avulla luotuja väärennettyjä videoita tai ääniä. Ne syntyvät syväoppimisalgoritmeilla, jotka analysoivat suuria määriä aitoja kuvia ja videoita tietyistä henkilöistä. Syväväärennökset voivat olla erittäin vakuuttavia ja niiden tunnistaminen voi olla haastavaa. Ne voivat aiheuttaa merkittäviä ongelmia, kuten väärän tiedon levittämistä, henkilökohtaisen maineen vahingoittamista ja jopa poliittisen vaikuttamisen yrityksiä. 

    Tekoälypohjaiset selaintyökalut, kuten Reality Defender, pyrkivät tunnistamaan syväväärennökset ja muut väärennetyt mediat. Nämä työkalut käyttävät tekoälyalgoritmeja havaitakseen vihjeitä, jotka viittaavat siihen, että kuva tai video on saatettu väärentää. 

    On tärkeää olla tietoinen syväväärennöksistä ja niiden mahdollisista vaikutuksista. Vaikka tekoäly voi olla voimakas työkalu sisällöntuotannossa, sen käyttöön liittyy myös vastuuta ja tarvetta kriittiseen lähestymistapaan. Sisällöntuottajien ja kuluttajien on oltava valppaina ja tarkistettava lähteet, kun he kohtaavat mahdollisesti väärennettyä sisältöä.

    Apua sisällöntuotantoon

    Toisaalta tekoäly on arvokas työkalu sisällöntuotannossa. Se voi auttaa videoiden editoinnissa, kuvien parantelussa, tekstien kirjoittamisessa, graafisten esitysten luomisessa ja audiosisältöjen tuottamisessa. Tekoäly voi esimerkiksi automatisoida rutiininomaisia tehtäviä, kuten kuvien luokittelua tai transkriptioiden luontia, vapauttaen näin sisällöntuottajien aikaa luovalle työlle.

    Tekoäly toimii sisällöntuottajan työkaluna monin tavoin. Se voi tarjota ideoita ja inspiraatiota, auttaa kielenkäännöksissä, parantaa tekstien laatua ja auttaa ymmärtämään yleisöä paremmin datan analysoinnin kautta. Tekoäly voi myös auttaa luomaan personoituja kokemuksia yleisölle, mikä on erityisen tärkeää markkinoinnissa ja mainonnassa.

    Mahdollisuuksia ja riskejä

    Tekoälyn tuottaman sisällön totuudenmukaisuus on toinen merkittävä kysymys. Vaikka tekoäly voi tuottaa tietoa ja sisältöä, se ei aina erota faktaa fiktiosta. Tämä voi johtaa harhaanjohtavan tai virheellisen tiedon leviämiseen. Siksi on tärkeää suhtautua kriittisesti tekoälyllä tuotettuun sisältöön ja tarkistaa lähteet.

    Lopulta tekoälyn sietämätön keveys on tasapainoilua sen tarjoamien mahdollisuuksien ja siihen liittyvien riskien välillä. On tärkeää, että kehitämme ja käytämme tekoälyä vastuullisesti, jotta voimme hyödyntää sen etuja minimoiden samalla sen mahdolliset haitat. Sisällöntuottajana tekoäly on voimakas liittolainen, mutta sen käyttö edellyttää eettistä harkintaa ja kriittistä lähestymistapaa.

    Tämä teksti on tuotettu Copilotilla. Sen prompti oli: ”Kirjoita 3500 merkin blogiteksti aiheesta tekoälyn sietämätön keveys. Kerro tekoälyyn liittyvistä eettisistä haasteista ja siitä, kuinka totuudenmukaista sisältöä tekoäly voi tuottaa. Miten tekoälyllä tehtyyn sisältöön kannattaa suhtautua. Kerro toisaalta, miten tekoäly auttaa sisällöntuotannossa (videot, kuvat, tekstit, graafiset esitykset ja audiosisällöt). Millä tavalla tekoäly toimii työkaluna sisällöntuottajalle?” Copilot ehdotti myös lisää tekstiä syväväärennöksistä. Editoin saamani sisällön tekstin sisään. Poistin myös Copilotin antamat linkit esimerkkeihin, koska ne eivät johtaneet minnekään. Lisäksi poistin väliotsikot ja muotoilin ne itse. Kuva on tehty Photoshopilla promptilla ”tekoälyn sietämätön keveys”. Sain kuvan neliönä, joten laajensin sen promptaamalla vaakakuvaksi.

    Promptaaja ja editoija: Minna Kilpeläinen, FM ja KM, viestintäasiantuntija, Oulun yliopiston Kerttu Saalasti Instituutti
    Kuva: Photoshop

    Tämä kirjoitus on julkaistu ensimmäisen kerran Oulun yliopiston Kerttu Saalasti Instituutin blogissa 7.8.2024: https://www.oulu.fi/fi/blogit/kerttu-saalasti-instituutin-blogi/tekoalyn-sietamaton-keveys

  • Dream Machine luo todentuntuisia videoita

    Luman julkaisema Dream Machine luo parhaimmillaan todentuntuisia videoita. Videoita voi luoda tekstikehotteesta tai valokuvasta sekä niiden yhdistelmästä. Suosituksi noussut malli kuuluu tämän hetken parhaimpiin videogeneraattoreihin. Mallia pääsee testaamaan maksutta osoitteessa https://lumalabs.ai/dream-machine

  • Kuinka tekoäly vaikuttaa teolliseen muotoiluun – haastattelussa muotoilija Kristian Talvitie

    Kuinka tekoäly vaikuttaa teolliseen muotoiluun – haastattelussa muotoilija Kristian Talvitie

    Tekoälytyökalut ovat yleistyneet laajasti luovalla alalla, eikä teollinen muotoilu ole poikkeus. Muotoilija Kristian Talvitie on ottanut tekoälyn vahvasti osaksi omaa työskentelyään.

    – Muotoilijan näkökulmasta tekoäly toimii hyvänä työkaverina, sanoo muotoilija Kristian Talvitie.

    Talvitie on erikoistunut ajoneuvomuotoiluun, joka edustaa monessa suhteessa klassista teollista muotoilua. Muotoilun työskentelytavat ovat kuitenkin muuttuneet jatkuvasti. Talvitie on työuransa aikana ehtinyt jo näkemään alalla tapahtuneen muutoksen tusseilla tapahtuvasta konseptipiirtämisestä 3D-mallintamiseen. Nyt työskentelytavat ovat jälleen muuttuneet generatiivisten tekoälytyökalujen myötä.

    Kristian Talvitie käyttää muun muassa Vizcom-tekoälytyökalua, joka sopii teollisen muotoilun visualisointiin. Vizcom muuttaa luonnokset nopeasti konseptikuviksi. Näin erilaisia ideoita on entistä nopeampi testailla ja esimerkiksi materiaaleja voi kokeilla vaivattomasti.

    Kristian Talvitie aloittaa ideointiprosessin tekemällä nopeita luonnoksia vihkoonsa. Luonnokset hän syöttää tekoälyohjelmistolle, jonka avulla voi tuottaa konseptikuvia.
    Vizcom teki luonnoksesta hetkessä mallin, jota voi työstää edelleen yksityiskohtia muuttamalla tai versioita tehden.

    Talvitie käyttää tekoälyä myös alkuvaiheen ideointiin. Midjourney-kuvageneraatiotekoälyn avulla hän rakentaa olemassa olevista kuvista uudenlaisia mukaelmia. Esimerkiksi mood boardien eli tuotteen tunnelmaa kuvaavien kollaasien tekeminen on entistä helpompaa. Teknologia on nopeuttanut monia prosesseja, mutta toisaalta muotoilija aloittaa ideoinnin useimmiten edelleen kuulakärkikynällä luonnostellen.

    Ihmiselle on tarvetta tulevaisuudessakin

    Vaikka moni asia on helpottunut tekoälyn myötä, vaatii muotoilu Kristian Talvitien mukaan moniaistillista lähestymistä. Siksi tekoäly ei voi täysin korvata ammattilaisen työpanosta.

    Uusimmat tekoälymallit pystyvät jo multimodaaliseen toimintaan, eli ne pystyvät tulkitsemaan tekstin, puhutun kielen ja laitteen kameran videosyötteen osana keskustelua. Vaikka tekoäly pystyy ymmärtämään äänenpainoja ja jopa kommunikoimaan tunteellisista asioista, se ei silti kykene oikeasti tuntemaan tunteita.

    Tunteet ja myös fyysinen tunne on muotoilussa tärkessä osassa. Talvitie pitää tärkeänä esimerkiksi sitä, miltä materiaali tuntuu sitä kosketettaessa. Vaikka tekoälymallille voitaisiin opettaa, millaisista materiaaleista ihmiset pitävät, ei tekoäly pysty itse kokemaan materiaalin tuntua.

    Tekoälyyn liittyy myös uhkakuvia. Tulevaisuudessa erilaisten asioiden tuottaminen voi olla entistä nopeampaa, mikä lisää kertakäyttökulttuurin riskiä. Talvitie ajattelee kuitenkin, että ihmisen osaamiselle on edelleen tarve. Hän arvelee, että tekoälyn myötä ihmisen tekemän tuotteen arvostus voi jopa kasvaa.

    – Me ihmiset kuitenkin tiedämme parhaiten, mitä itsellemme haluamme.

  • OpenAI julkaisi uuden GPT-4o -mallin

    OpenAI on julkaissut uuden GPT-4o -mallin. Se toimii rajoitetuilla ominaisuuksilla myös ilmaistileillä. Malli on todella nopea ja merkittävä parannus ilmaiseen 3.5-malliin. GPT-4o pystyy periaatteessa multimodaaliseen vuorovaikutukseen, eli se tunnistaa mm. puheen äänenpainot ja rytmin sekä kameran kautta keskustelijan ilmeet, eleet ja ympäristön. Näitä ominaisuuksia ei ole vielä toistaiseksi käytössä, mutta linkin takana olevasta artikkelista löytyy esimerkkivideoita.

    Lue lisää GPT-4o -mallista OpenAI:n verkkosivulta.

  • Tekoäly hittibiisien tehtailuun: Suno

    Tekoäly hittibiisien tehtailuun: Suno

    Musiikkikappaleen tekeminen ei ole koskaan ollut näin helppoa. Tekstistä musiikiksi -tekoäly Suno mahdollistaa kokonaisen biisin tekemisen vain muutamalla kuvailevalla sanalla. Parin minuutin kuluttua käyttäjä saa kaksi valmista kappaletta.

    Sunon uusi v3-malli tekee uskottavaa jälkeä myös suomeksi. Alla Sunon tekemä suomenkielinen kappale kehotteella ”Tee kappale luovuudesta ja tekoälystä”:

    Englanninkielisillä sanoilla malli toimii vielä paremmin. Kehotteella ”Make a song about creativity and artificial intelligence” syntyy seuraavaa:

    Jos kappaletta haluaa työstää pidemmälle, on mahdollista käyttää Custom Modea, joka sallii kappaleen sanoittamisen kokonaan tai osittain. Juuri tätä enempää kontrollia lopputulokseen ei valitettavasti toistaiseksi ole, joten käyttäjä on tekoälyn generoinnin varassa. Kokeillaan vielä seuraavaksi siten, että annetaan saman aiheen sanat GPT 4-kielimallin tekemänä ja laitetaan tyylilajiksi rap:

    Mitä lähempänä kappaleet ovat radiossa ja soittolistoilla suosittuja genrejä, sitä todennäköisemmin Suno onnistuu. Pienet vaihtoehtotyylilajit tai kansalliset erikoisuudet eivät todennäköisesti ole lopputulokseltaan kummoisia.

    Pikatietä muusikoksi Suno ei silti takaa, eikä se ehkä ole musiikkikentälle niin suuri mullistus kuin äkkiseltään voisi kuvitella. Biisejä on jo pitkään voinut tehdä suhteellisen nopeasti esimerkiksi looppikirjastoja käyttämällä, mutta tie artistiksi on edelleen pitkä ja kivinen. Monessa genressä myös aito soittaminen ja laulaminen on keskiössä. Striimipalveluiden myötä muusikon tulot tulevat entistä enemmän keikkailusta. Sitä tekoäly ei tee, sillä se ei voi esiintyä keikalla ihmisenä ihmisen puolesta.

    Sen sijaan Sunolle löytynee käyttötarpeita muissa yhteyksissä. Esimerkiksi videon taustalle voi helposti tehdä kappaleen tai syntymäpäiväonnittelun voi tehdä vastaanottajalle kirjoitetulla laululla. Ammattimuusikotkin varmasti keksivät käyttökohteita ja voivat vaikkapa samplata Sunon tekemiä kappaleita taiteellisesti kunnianhimoisiin lopputuloksiin. 

    Suno myös avaa katsetta tulevaisuuteen, jossa radiokanava voi toimia jatkuvasti uutta musiikkia generoimalla. Se tuskin syrjäyttää nykymuotoista musiikkia toistavia radioita, mutta esimerkiksi taustamusiikin, niin sanotun hissimusiikin tapauksessa menetelmä voisi olla hyvinkin toimiva.

    Sunon käyttäjät saavat maksuttomasti käyttöönsä joka päivä 50 kredittiä, joilla tekee kymmenen kappaletta, eli albumillisen päivässä. Ilmaisversiota ei saa käyttää kaupallisesti, mutta jo kahdeksan dollarin kuukausihintaan saa mahdollisuuden käyttää tekemiään kappaleita kaupallisesti.

  • Talvi vai kesä? Värianalyysiä ChatGPT:llä.

    Talvi vai kesä? Värianalyysiä ChatGPT:llä.

    TikTokin kautta suosiotaan kasvattanut värianalyysi opastaa, mitkä värit sopivat oman ihon ja silmien väriin parhaiten tuoden kasvoille luonnollista hehkua. Yksi tapa tehdä värianalyysiä on jaotella ihmiset 12 eri vuodenaikatyyppiin. Some on pullollaan applikaatioita ja filttereitä, joiden avulla itseään voi arvioida, mutta tämäkin vaatii harjaantunutta silmää ja näkemystä. Värianalyysin voi myös ostaa palveluna. Päätin kuitenkin kokeilla, miten tekoäly suoriutuu tästä tehtävästä.

    Ensin yritin poimia kuvistani HEX-värikoodeja (esim. #C54D82) puhelimen ”Kuvat” sovelluksen avulla ja kysyä ChatGPT:n analyysiä näiden tietojen valossa. Koska en tuntunut löytävän kirjavalta iholtani suoraan ”pipetti”-työkalulla sopivaa sävyä, ohjasin ChatGPT:tä kirjallisesti muokkaamaan HEX-arvoa: ”mikä olisi tästä asteen verran vaaleampi sävy”? ”Mikä olisi yhtä vaalea, mutta vähemmän vihreä sävy?”

    Sain aikaan koodeja, mutta ei tuntunut toimivalta, joten muutin lähestymistapaani. Tekstin sijaan annoin syötteet suoraan kasvokuvina, joita syötin ChatGPT:lle yhteensä 8. Näiden perusteella pyysin arviota talvi-kevät-kesä-syksy -jaottelun mukaisesti. ChatGPT antoikin varsin tarkan arvion, pohtien valintaa juuri niiden kahden saman tyypin väliltä, joita itsekin olin puntaroinut.

    Hupaisaa tekoälyn kanssa keskusteluissa oli se, että tekoälyn kohteliaisuus tuntui haittaavan totuudenmukaista analyysiä. Tekoälyltä voisi olettaa viiltävän suoraa analyysiä, mutta sainkin imartelua ja kehuja kuvissa olleiden vaatteiden väreistä. Vasta kun suoraan pyysin unohtamaan kohteliaisuusseikat ja sanomaan suoraan, sain ulos tarkempia vastauksia. Jäin silti pohtimaan, oliko analyysi todellinen vai yrittikö ChatGPT vain mukailla jo tekemiäni pukeutumisvalintoja ja värimaailmoja. Halusiko tekoäly miellyttää minua?

    Oli miten oli, pyysin lopuksi tekoälyltä suosituksen kunkin perusvärin sävystä, joka minulle sopisi parhaiten ja sain ainakin kivan kokoelman raikkaita ja yhteensopivia värikoodeja! Jos en omaan pukeutumiseeni, niin vaikkapa jonkun graafisen aineiston väripaletiksi. En kuitenkaan osannut kuvatyökaluilla tätä saamaani koodistoa muuntaa kuvaksi, jossa olisin voinut tarkastella, miten ne todella sopivat kasvoihini tai ylipäänsä kokonaisuutena. En tiedä oliko vika enemmän käyttäjässä kuin työkaluissa, mutta ihan maaliin ei päästy.

    Ja ehkä värianalyysin kokemuksesta jäi jotain muutakin tällä tavalla puuttumaan, kohteliaisuudetkin tuntuvat paremmalta oikean ihmisen suusta kuultuna ja ehkä värien näkeminen ja kokeminen koodien sijasta olisi saanut aivoissa aikaan enemmän mielihyvää. Mutta ideoita ja rentoa oppia tekoälyllä leikittelystä tästä sai!