OpenAI julkaisi juuri uuden version GPT-4o:sta. Malli sai merkittäviä uusia kykyjä: se ei enää pelkästään kirjoita ja keskustele, vaan osaa myös katsoa, kuunnella ja puhua – sekä tietenkin luoda kuvia suoraan kehotteesta. Mutta onko kyse aidosta mullistuksesta vai vain teknisestä pakkopullasta, jonka äärellä meidän muiden täytyy teeskennellä ymmärtävämme, mitä tapahtuu?
Ymmärtämistä ei helpota, että jostain syystä kielimallit nimetään ja versionumeroidaan tavalla, jossa menneen maailman sovjetologista voisi olla hyötyä. Sillä nimellähän kutsuttiin erityiasiantuntijoita, joiden epäkiitollisena tehtävänä oli yrittää teenlehdistä tulkita mitä hittoa Kremlin muurien sisällä oikein ajatellaan. Viime aikojen tapahtumat ovat valitettavasti alkaneet maistua tutun kitkerältä tsajulta, välillä odottamattomilla mantereillakin. Voihan Grok! No mutta.
Uusi, entistä ehompi GPT-4o alkaa nyt lähestyä niin sanottua omnimodaalista mallia. Se siis yhdistää tekstin, kuvan ja äänen käsittelyn samaan järjestelmään. Käytännössä tämä tarkoittaa, että käyttäjä voi keskustella ChatGPT:n kanssa esimerkiksi valokuvasta, pyytää sitä luomaan kuvituksia, tai jopa kommunikoida puheen kautta. Tämä multimodaalisuus on ollut tekoälyn kehityksessä pitkään odotettu askel, mutta sen käytännön vaikutukset ovat vasta hahmottumassa.
Vaikka OpenAI on nyt otsikoissa, se ei ole yksin liikkeellä. Melkein kaikilla muillakin isoilla on ollut vähintään kehitystyötä meneillään. Meta jo julkaisikin toimivia systeemejä aiemmin keväällä, ja kokeiluja jo viime vuoden puolellakin. Omat virityksensä on ollut Googlella ja Anthropicillakin.
Nyt näyttää kuitenkin siltä, että OpenAI on onnistunut sekä kuromaan muiden etumatkan sekä kiinni, että luomaan tavalliselle käyttäjälle helpoimmin lähestyttävän kokonaisuuden. ChatGPT:n kuvanluontikyvyt eivät ole enää erillisen DALL·E-sovelluksen takana, vaan suoraan osa ChatGPT:tä. Pitkään odotellun DALL·E 3:n ominaisuudet näyttäisivät nyt olevan osa viimeisimmän GPT-4o -version työkaluvalikoimaa.
Suuri yleisö on ottanut uudet ominaisuudet vastaan valtavalla innolla. Ainakin meidän some-kanavat pullistelevat ihmisten testejä, ällistystä ja ihmettelyä. Kieltämättä niissä esiintyy toinen toistaan huikeampia ominaisuuksia. Kielimalli, joka pystyy samalla kertaa katsomaan valokuvaa, kirjoittamaan siitä runon, keskustelemaan tyyliseikoista ja ehdottamaan kuvankäsittelyä, kuulostaa enemmän tieteiskirjallisuudelta kuin perusmaanantailta. Mutta kuulostipa se miltä tahansa, nyt se on arkipäivää. Simsalabim vaan.
Mutta eipä ole kritiikkikään kadonnut mihinkään, päin vastoin. Tekoälyn kyky sekoittaa tekstiä, kuvaa ja ääntä herättää kysymyksiä siitä, missä nyt taas kulkee raja ihmisen ja koneen välillä. Luovan teollisuuden ja taideväen suunnalta kuuluu sekä hämmentynyttä alavireisyyttä että kiukkuista taistelutahtoa. Kuka omistaa kuvan, jonka tekoäly tuottaa käyttäjän kehotteesta, koulutettuna kymmenillä miljoonilla ihmisten tekemillä kuvilla? Entä mitä tapahtuu sille mystiselle, hitaaseen ja hikiseen ajatteluun perustavalle ilmaisulle, jota taiteeksi on perinteisesti kutsuttu?
OpenAI itse vakuuttaa, että GPT-4o:n uudet ominaisuudet on suunniteltu tukemaan, ei korvaamaan. Mutta tuki saattaa näyttää eri ihmisestä eri suuntaan: toinen näkee vapauttavan yhteistyön, toinen hiljaisen syrjäyttämisen.
Taide ja teknologia ovat olleet ristiriitaisessa suhteessa ennenkin. Aikanaan pelättiin, että kamera vie maalareilta pensselin suusta. Toiset näkivät valokuvauksen avaavan kokonaan uuden maailman. Sama jännite leijuu ilmassa nyt, kun tekoäly alkaa puhua, nähdä ja luoda.
Me täällä Fleuve.ai:ssa seuraamme tekoälyn kulttuurisia seikkailuja aktiivisesti ja yritämme pysyä kehityksen aallonharjalla – tai ainakin skootterinmitan perässä. Tämäkin juttu syntyi tekoälyn ehdottamana ja luonnostelemana. Ihminen tuunasi hieman sävyä, viilasi faktoja ja lisäsi kolhiintuneen vitsin ja ripauksen ironiaa. Mutta rehellisyyden nimissä täytyy myöntää, etteivät nämä koneen tekstit kovin kaukana enää julkaisuvalmiista ole. Valitettavasti.
Jos kaipaat rauhoittelua näinä hurjina aikoina, tai luottamuksellista kahdenkeskistä pohdiskelua siitä, mihin tekoäly on menossa, niin ota yhteyttä. Meiltä saa sekä teknistä että filosofista käyttöopastusta. Ja lohtua.

