index.php

Kansallinen tekoälytragedia

 

Kuplaa puhaltamassa

”Uskon, että elämme suurinta arjen, työn ja vapaa-ajan vallankumousta sitten teollistumisen.” ”Uskon, että tekoäly tulee seuraavan viiden vuoden aikana muuttamaan meidän kaikkien jokapäiväistä elämää.” ”Tekoäly on uusi sähkö.” Näin juuri väistynyt elinkeinoministeri Mika Lintilä kuvaa lähestyvää suurta murrosta. Hän on ohjannut osana kaatuneen hallituksen digitalisaatiostrategiaa kansallista tekoälyohjelmaa, jonka tavoitteena on selvittää, mitä mahdollisuuksia ja haasteita tekoäly tarjoaa ja miten Suomen tulisi sen tuloon varautua.

Lintilän lausunnot ovat linjassa hanketyöryhmän raporttien kanssa: ”Tekoälyteknologia on disruptiivista eli merkittävästi aiempaa mullistavaa.” ”Tekoälyajassa julkinen hallinto huolehtii perus- ja ihmisoikeuksista entistä paremmin.” ”Tekoälyn ja digitalisaation avulla voidaan entistä laajemmalle joukolle tarjota hyvää ja yksilöllistettyä opetusta matalammin kustannuksin.”

Suomen edistyksellisyys on havaittu myös maailmalla. Politico-verkkojulkaisu noteerasi tammikuussa tekoälyohjelmamme positiiviseen sävyyn. Artikkelissa kerrottiin, miten tavoitteenamme on kouluttaa 1% kansasta tekoälyosaajiksi ja esiteltiin 59-vuotias hammaslääkäri, joka on ohjelman puitteissa alkanut opetella koodaamista.

Lintilä ennustaa, että viiden vuoden päästä tulemme hyödyntämään tekoälyä kuten sähköä tänään. Tämä on siitä turvallinen ennustus, ettei tekoälylle ole olemassa määritelmää. Koneet ovat jo kauan sitten ohittaneet ihmisen monissa tehtävissä, joiden on ajateltu edustavan älykkyyttä, emmekä edelleenkään pysty määrittelemään, mitä äly oikeastaan on. Varmaa sen sijaan on, etteivät koneet edelleenkään ymmärrä, mitä tekevät.

”Tekoäly” onkin parhaimmillaan optimistinen nimitys koneoppimismenetelmille. Pahimmillaan – ja yleisemmin – se on sisällötön markkinointitermi, jolla tehdään mistä tahansa ohjelmistosta salonkikelpoinen. Lontoolaisen pääomasijoitusyhtiö MMC:n selvityksen mukaan 40% aloittelevista eurooppalaisista ”tekoäly-yrityksistä” ei käytä koneoppimista millään tavalla.

Tekoälyhypessä on nähtävissä paljon samaa kuin 90-luvun IT-kuplan syntyvaiheissa. Powerpoint-esityksissä ja nyt myös Youtube-videoissa hehkutetaan disruptiota, koska muutkin ovat sitä mieltä, että kyseessä on disruptio. Toimivien teknisten ratkaisuiden ja liiketoimintamallien saralla on hiljaisempaa.

 

Kolmas kerta toden sanoo?

Kun tekoälystä ensimmäisen kerran tosissaan innostuttiin 1960-luvulla, ennustettiin, että viiden vuoden päästä robotit hoitavat kaikki ikävät kotiaskareet. Vastaavia visioita maalailtiin myös 1990-luvun vaihteessa. Nyt tekniikka on taas ottanut edistysaskeleen, mutta historiasta on opittu nähtävästi hyvin vähän.

Mitä tulee tekniikan nykytasoon, mitään todellista läpimurtoa ei ole tapahtunut. Koneiden laskentateho on kyllä kasvanut ja olemme kehittäneet oppimismenetelmiä niin, että pystymme rakentamaan syviä neuroverkkomalleja. Oppimismenetelmien perimmäisissä toimintaperiaatteissa ja niistä seuraavissa rajoitteissa ei kuitenkaan ole tapahtunut ratkaisevia muutoksia sitten 60-luvun. Onkin mahdollista, että merkittävin tekijä koneoppimisen soveltamismahdollisuuksien laajentumisessa on ollut internetin ja sosiaalisen median kautta saatavan opetusdatan määrä.

Koneoppimismenetelmät oppivat sen, mitä niille opetetaan. Algoritmit kaivavat annetuista tiedoista ne piirteet, jotka tehokkaimmin erottelevat tiedot haluttuihin luokkiin. Menetelmä ei voi tietää, onko sen valitsemilla piirteillä merkitystä laajemmassa asiayhteydessä. Niinpä se oppii tunnistamaan leopardin sen turkissa olevien täplien muodon perusteella ja on varma siitä, että tällainen täplä hihassasi sinäkin olet leopardi.

Algoritmien on havaittu oppivan myös vaikkapa opetusdataan sisältyvän rasismin. Jos pyydät koneoppimismallia tekemään kuvastasi kauniimman, se voi tehdä siitä valkoihoisen. Tuomioistuimen apulaisena se osaa myös (virheellisesti) ennustaa, että tummaihoinen on suuremmassa riskissä uusia rikoksensa. Hankalinta on, ettemme osaa selvittää, mitä koneoppimismenetelmä on oikeastaan oppinut, ja miten se tekee päätöksensä.

Suurin haaste koneoppimismenetelmien käytössä ei olekaan itse menetelmän opettaminen. Nykyisillä työkaluilla voi hämmästyttävän hyviltä näyttäviä tuloksia saada aikaan hyvinkin vähäisellä osaamisella. Useimmiten nämä tulokset kuitenkin ovat hyödyttömiä tai jopa vakavasti harhaanjohtavia.

Pohjimmiltaan koneoppimismallit ovat edelleen vain monimutkaisia tilastollisia malleja. Jos opetusdatan tilastollisia ominaisuuksia ja niiden vaikutusta oppimismenetelmän ominaisuuksiin ei ymmärrä, tulos voi olla mitä vain. ”Garbage in, garbage out” on alalla usein käytetty sanonta.

En kuitenkaan vähättele koneoppimismenetelmien käyttökelpoisuutta, päinvastoin. Niillä voi todella ratkaista ongelmia, joihin kone ei aiemmin pystynyt. Tämä ei kuitenkaan riitä tekemään teknologiasta ”disruptiivista”, sillä jokaisella tietokone- ja ohjelmistosukupolvella on ollut tämä ominaisuus.

Tekoäly on disruptiivista siinä missä vaikkapa taulukkolaskenta: osaavissa käsissä erittäin tehokas keino ratkaista tietyn tyyppisiä ongelmia. Monet niistä ongelmista, joita tekoälyllä ajatellaan ratkaistavan, olisivatkin luontevammin ratkaistavissa juuri taulukkolaskennalla.

 

Suhteellisuudentajua etsimässä

Kansallisen tekoälyohjelman viime vuonna julkaiseman raportin, ”Tekoälyajan työ”, mukaan ”on arvioitu, että tulevaisuudessa Suomen työelämässä olevasta työvoimasta jopa miljoona ihmistä on syytä täydennys- tai uudelleenkouluttaa.” Se on hieman alle puolet tällä hetkellä työssä käyvistä suomalaisista. Arvio esitetään passiivissa ilman lähdeviitettä, mutta se perustunee työryhmän edellisessä raportissa esitettyyn McKinsey-konsulttiyhtiön arvioon, jonka mukaan ”noin 40% kaikesta työstä voitaisiin automatisoida tekoälyn avulla”.

On helppo ennustaa, että tietokoneita ja niihin ohjelmoituja oppivia algoritmeja käytetään enenevässä määrin monien ammattien tukena. Ihmisiä tullaan edelleenkin korvaamaan koneilla mekaanisissa ja muissakin työtehtävissä. On kuitenkin hyvin vaikea uskoa työryhmän siteeraamaan McKinseyn raporttiin, jonka mukaan ”tekoäly tuhoaa noin 15% työpaikoista vuoteen 2030 mennessä ja muuttaa työn luonnetta huomattavasti tätä suuremmassa osassa tehtäviä”. Sitä, mitä töitä tekoäly korvaa saati miten tämä käytännössä tapahtuu, käsitellään ympäripyöreästi.

Vaikuttaakin, että raportti on enemmän toiveikasta pohdiskelua kuin tosielämässä kiinni olevaa analyysiä. Ihmisen korvaaminen koneella mekaanisessakin työssä on nimittäin huomattavasti haastavampaa kuin mitä internetin, akateemisten julkaisujen tai konsulttien tekemien selvitysten perusteella voisi kuvitella.

 

Tekoäly on tietokoneohjelma

Hyvin harvoihin sovelluksiin on saatavilla koneoppimismalli, jota voitaisiin käyttää sellaisenaan. Uuden, reaalimaailmassa toimivan mallin kehittäminen taas vaatii paljon dataa, työtä ja osaamista. Eikä malli itsessään ole vielä ratkaisu mihinkään ongelmaan, vaan ympärille tarvitaan ainakin ohjelmisto, joka kerää tiedon ja jalostaa tulokset käyttökelpoiseen muotoon.

Sitten täytyy tuotteistaa ratkaisu ja pystyä osoittamaan potentiaaliselle ostajalle investoinnin takaisinmaksuaika. Hinnassa on huomioitava työntekijän irtisanomisesta seuraavat hankaluudet ja se, ettei kone pysty kuin yhteen, tarkasti rajattuun tehtävään.

On paljon työtehtäviä, jotka olisi voitu automatisoida jo kauan sitten varsin perinteisillä koneoppimismenetelmillä. Vielä enemmän on työtehtäviä, joita voitaisiin tehostaa ihan tavanomaisilla ohjelmistoilla. Näin ei kuitenkaan ole käynyt joko siksi, ettei ole osattu tai siksi, ettei ole kannattanut.

Konsulteilta vaikuttaa unohtuneen, ettei teknologia itsestään siirry tuotantolinjalle tai julkishallintoon. Koneoppimisalgoritmi päätyy käyttöön vasta sitten, kun sen sisältävä IT-projekti saadaan valmiiksi. ”Tekoäly” merkitseekin lopulta varsin tavallisia ohjelmisto- ja tietojärjestelmähankkeita.

 

Kansallinen taulukkolaskentastrategia

Mika Lintilä toteaa Politicon artikkelissa, ettei Suomella ole ikinä varaa olla johtaja tekoälyteknologioissa. Sen sijaan hän on asettanut tavoitteeksi, että Suomi olisi näiden teknologioiden hyödyntämisessä etujoukoissa. Tämä on häviäjän strategia.

Jos tyydymme hyödyntämään muiden kehittämää teknologiaa, olemme lähtökohtaisesti aina jäljessä kehityksestä. Ja jos uskomme siihen, että tekoäly on viiden vuoden päästä yhtä luonnollinen osa elämäämme kuin sähkö nyt, sen käyttäminen tuskin voi vaatia erityistaitoja.

Strategia tuntuukin perustuvan siihen harhaluuloon, että tekoälyn kehittäminen vaatii valtavia resursseja, mutta käyttäminen onnistuu keneltä vain. Muuten ei liene selitettävissä se, että tekoälyajan haasteisiin tarjotaan ratkaisuksi eläkeikää lähestyvien hammaslääkärien lisäkoulutusta.

Koneoppiminen ei vähennä matematiikan tai ohjelmistotekniikan osaamisen tarvetta, vaan pikemminkin lisää sitä. Resurssit tulisikin suunnata näiden perustaitojen opettamiseen. Tällä osaamisella on käyttöä myös sen jälkeen, kun tekoälykupla on taas kerran puhjennut.

Työelämän tehostaminen puolestaan voitaisiin aloittaa siitä, että opetettaisiin tilastomatematiikan ja taulukkolaskennan perusteet nykyistä laajemmalle joukolle. Ilman näitä taitoja on turha haaveilla koneoppimisenkaan tehokkaasta soveltamisesta.