Tekoälyn käyttö tutkimuksessa – kokemuksia

Tekoälyn käyttö oikeustieteen tutkimuksessa on vielä vähäistä ja hapuilevaa. Varmaa kuitenkin on, että käyttö yleistyy, uusia käyttötapoja tekoälylle löydetään ja tutkimuseettiset ongelmat nousevat esiin. Tällä hetkellä useimmat käyttävät tekoälyä joko tutkimuksen alussa tai sen päätteeksi. Ensimmäisessä tutkija pyytää tekoälyä laatimaan tiivistelmiä tai selostuksia aihepiiristä, johon hän aikoo käydä kuvainnollisesti käsiksi. Tätä voidaan kutsua tekstiä tuottavaksi eli generoivaksi käytöksi. Tekoäly ei luo mitään uutta eikä se osaa välttämättä erottaa, mikä on totta, mikä ei. Tekoäly kuitenkin osaa erinomaisesti koota ja tiivistää olemassa olevan tietämyksen, usein vielä valmiiksi jäsennettynä. Näin tutkija pääsee helposti sisään aiheeseen ja näkee, mitä kannattaa tehdä, toisin sanoen mistä on aikaisempaa tutkimusta ja mistä sitä ei ole. Jälkimmäinen eli valkoinen tai harmaa alue tutkimuksessa on luontainen tutkimuskohde perustutkimukselle. Näitä luonnoksia työstämällä tutkija saa nopeasti valmiiksi tutkimuksen, joka päällisin puolin näyttää vuosien työltä.

Toinen käyttötapa on juuri kirjoitetun (tai ainakin pitkällä olevan) oman tekstin analysointi. Tällöin tutkija pyytää tekoälyä analysoimaan omaa tekstiään. Tekoäly antaa toisin sanoen tekstistä analyyttisen palautteen. Tekoälyohjelma pystyykin palautteen antaessaan hämmästyttäviin suorituksiin: se jäsentää esityksen, löytää tutkimustulokset tai kertoo niiden puuttumisesta, karsii pahimpia persoonallisia maneereja sekä ehdottaa monenlaisia korjauksia alkuperäistekstiin. Tässä puuhassa tekoäly on ihanteellinen apulainen. Sillä on aina aikaa, tekoäly ei, toisin kuin toinen tutkija, vetoa omiin kiireisiinsä kuten opetukseen eikä se anna kirjoittajan akateemisen statuksen tai henkilökohtaisen suhteen vaikuttaa. Analyysi on sama, pyysi sitä ensimmäistä artikkeliaan tuskalla kirjoittava väitöskirjantekijä tai oikeudenalan emeritusprofessori. Tekoäly suostuu myös mukisematta lukemaan yhä uusia käsikirjoitusversioita ja samalla innolla kommentoimaan kuudetta versiota kuin ensimmäistä. Kokemus osoittaa, että avuliainkin inhimillinen esilukija alkaa tässä vaiheessa olemaan jo kovin kiireinen.

Tekoäly on ohjelmoitu hienotunteiseksi; se ei sano mitään ilkeää, oli analysoitava teksti millainen kauhistus tahansa. Ellei tekoälyä käyttävä tutkija tätä muista, hän kuvittelee itsestään ja teksteistään liikoja. Tästä syystä tekoälyn ja ihmisen tekemää analyysiä (jos sellainen on saatavissa) kannattaisi käyttää samanaikaisesti. Kokemus osoittaa, että tekoälyn analyysistä tulee alkuun usein ilmoitus, että teksti on hyvää tai erinomaista, ehdotukset ovat lempeää ’ehkä voisi hieman parantaa’ -tyyliä. Tällaiset ”tulokset” ovat toki miellyttävää luettavaa ja kiusaus niihin uskomiseen inhimillistä. Tekoälyn analyysiin on kuitenkin pantava aina reilu ripaus suolaa. Tekoälyn ’erinomainen’ tarkoittaa ’keskinkertaista’, ’hyvä’ on oikeasti ’välttävää’, ’ehkä voisi hieman parantaa’ -ehdotus yrittää sanoa, että ’tee luojan tähden edes nämä korjaukset’.

Käyttökontekstit luovat omat tutkimuseettiset ongelmansa. Tekstin tuottamisessa eli luonnostelukäytössä joudutaan kysymään, missä määrin tutkijan tulee edelleen työstää tekoälyn tuottamia tekstejä, jotta niistä tulee ”hänen” tekstejään. Tekoälyn generoimassa kirjoittamisessa muodostuu näin eräänlainen tutkimuksellinen teoskynnys. Jos sen alle jäädään, tekoäly tulisi oikeastaan ilmoittaa tekijäksi tai kanssatekijäksi (näin ei tietysti oikeasti tehdä). Selvää on, että kynnys edellyttää jonkinlaista luovaa panosta tekstiin. Pelkät kielelliset muutokset tai parafraasit eivät siis riitä. Tekoälyn käytössä palautteen antajana ongelma taas on käänteinen; jos tekoälyn ehdotuksia seurataan liiaksi, lopputulos on tekoälyn eikä ihmisen aikaansaannos. Jos tekoäly ehdottaa laajoja rakenteellisia, metodisia tai sisällöllisiä muutoksia, ne vievät tutkijalta tekijyyden, mikäli lopullisessa tekstissä ne toteutetaan sellaisinaan. Vähintään tutkijan pitäisi tällaisessa tapauksessa ilmoittaa, että lopullinen teksti on joko tekoälyn laatima tai sen avulla kirjoitettu. Peukalosäännön antaa kuvitteellinen hyvän kustannustoimittajan panos. Jos tekoäly ei tee syvällisempiä korjauksia, sen osuus voidaan unohtaa. Kustannustoimittajaa on kylläkin tapana kiittää kirjan alkusanoissa tai lopun kiitoksissa, jos hänen apuaan on saatu tavanomaista enemmän. Vaikka tekoälyä ei ilkeä kiitellä, esimerkiksi maininta siitä, että tekoäly on huolehtinut kustannustoimittajan normaaleista tehtävistä, on paikallaan.

Tässä vaiheessa lukija alkaa olla kärsimätön. Hän tivaa näyttöä: onko tekoälyohjelma todella näin taitava ja onko syytä käyttää sitä oman tutkimuksen viimeistelyyn. Parasta näyttöä ovat konkreettiset kokeilut ja niiden tulokset. Sellainen onkin saatavilla aivan viime viikoilta. Kirjani ”Summaarinen asia, yksipuolinen tuomio ja takaisinsaanti” on parhaillaan graafikon taitossa ja ilmestynee lähiviikkoina. Tekoäly (ChatGPT Plus) on laatinut lukukohtaiset analyysit useimmista kirjan luvuista, osasta useampaan kertaan. Analyysin tuloksia käytettiin tekstin viimeistelyssä, sillä sen avulla esitystä pystyttiin selkiinnyttämään, sen ydinsanomaa keskittämään sekä häiritseviä maneereja stilisoimaan. Mitään todella uutta tekoälykään ei pystynyt tuomaan esiin. Se olikin odotettavaa: tekoälyhän ei ”keksi” mitään, mikä ei jo aineistosta käy ilmi. Voidaan sanoa, että tekoäly teki sen, minkä oivallinen kustannustoimittaja olisi tehnyt, kun hänellä olisi ollut siihen aikaa. Yleensähän kustannustoimittaja joutuu tinkimään työnsä tasosta, koska muita kirjoja on odottamassa. Yksi analyyseistä eli luvun 5 analyysi on alla, ja kiinnostuneet voivat verrata sitä käsikirjoituksen vastaavaan tekstiin. Tekstiin on kylläkin tältä osin tullut epätavallisen vähän muutoksia. Kirjan teksti on luettavissa huhtikuun uutisesta. Muita lukukohtaisia analyysejä on luettavissa tästä; kaikista luvuista analyysiä ei saatu, koska tekoälyn perusohjelmat eivät pysty analysoimaan kovin pitkiä tekstejä.

ChatGPT:n analyysi luvusta 5

Tämä luku on poikkeuksellisen tiheä ja samalla hyvin johdonmukainen yritys purkaa yksi summaarisessa lainkäytössä pitkään vaivannut jännite: mitä“virallistutkinta” oikeastaan tarkoittaa tilanteessa, jossa vastaaja on passiivinen. Ydinajatus on yllättävän radikaali, mutta samalla realistinen. Yritän jäsentää analyysin niin, että keskeinen argumentaatio ja sen seuraukset erottuvat.

1. Lähtökohta: klassinen kontumasiaalioppi vs. moderni virallistutkinta
Kirjoittaja aloittaa klassisesta kontumasiaaliopista: siinä tuomioistuin ei tutki vaatimuksen aineellista oikeellisuutta, vaan ratkaisee asian vastaajan laiminlyönnin perusteella. Tämä olisi “puhdas” malli. Keskeinen havainto on, että suomalainen (ja pohjoismainen) kehitys on jo pitkään poikennut tästä:
● tuomioistuimella on jonkinasteinen tutkimisvelvollisuus, vaikka vastaaja on passiivinen
● tämä on historiallinen poikkeus klassiseen teoriaan nähden Mutta heti tämän jälkeen tulee tärkeä empiirinen vastaväite: käytännössä virallistutkinta on lähes merkityksetön passiivisissa asioissa (esim. vain kymmeniä hylkäyksiä tuhansista).
→ Ensimmäinen keskeinen johtopäätös: doktriini ja käytäntö ovat irronneet toisistaan.

2. Koko luvun kantava teesi: “selvästi perusteeton” = näkyvyyskriteeri
Luvun ehkä tärkein oivallus on tämä: “Selvästi perusteeton” ei ole sisällöllinen vaan havaittavuuteen liittyvä kriteeri. Toisin sanoen:
● ei ole olemassa eri “asteisia” perusteettomuuksia (vakava vs. tavallinen)
● on vain perusteettomuus, joka on tai ei ole näkyvissä käytettävissä olevassa aineistossa
Tämä muuttaa koko asetelman: Mitä tämä tarkoittaa käytännössä?
Virallistutkinta:
● kohdistuu asiakirjoihin (käytännössä haastehakemus)
● toteutuu lukemalla ne normaalilla huolellisuudella
● päättyy, kun mitään ilmeistä ongelmaa ei löydy
Tuomioistuin ei:
● saa etsiä aktiivisesti piilossa olevaa virhettä
● saa rakentaa uusia tosiseikkoja
● saa tehdä “luovia” tulkintoja vastaajan suojelemiseksi
→ Tämä on erittäin selkeä normatiivinen rajaus.

3. Rakenteellinen ongelma: informaatioasymmetria
Kirjoittaja osoittaa vakuuttavasti, miksi virallistutkinta on väistämättä heikko:
● aineisto on yksipuolinen (kantajan tuottama)
● aineisto on niukka (suppea haastehakemus)
● vastaaja on passiivinen (ei korjaavaa tietoa)
→ syntyy rakenteellinen informaatioasymmetria
Tämä johtaa tärkeään, ehkä koko luvun realistisimpaan väitteeseen: Virallistutkinta ei voi missään mallissa antaa tehokasta oikeussuojaa passiiviselle vastaajalle. Tämä on vahva ja samalla epämiellyttävä johtopäätös, koska se:
● romuttaa idealisoidun käsityksen tuomioistuimen “suojaroolista”
● siirtää painopistettä järjestelmän muihin osiin

4. Prosessuaalinen jännite: määräämisperiaate vs. suojafunktio
Luvussa käsitellään jatkuvasti yhtä normatiivista konfliktia:
A. Määräämisperiaate
● vastaaja saa itse päättää, puolustaako itseään
● tuomioistuin ei saa “käydä oikeutta hänen puolestaan”
B. Oikeussuojatavoite (access to justice)
● passiivista vastaajaa pitäisi suojata perusteettomilta vaatimuksilta
Kirjoittajan ratkaisu on selkeästi kallistunut A:n puolelle:
● tuomioistuin ei saa eskaloida asiaa ilman vastaajan reaktiota
● edes selvä epäily ei oikeuta siirtämään asiaa jatkokäsittelyyn
→ Tämä on johdonmukainen mutta normatiivisesti kiistanalainen kanta.

5. “Selvästi” vs. “ilmeisesti” – kielellinen analyysi
Kirjoittaja tekee kiinnostavan kieli- ja tulkinta-analyysin:
● “ilmeisesti” → voi tarkoittaa myös todennäköisyyttä
● “selvästi” → viittaa havaittavuuteen
Johtopäätös:
● vuoden 1993 muutos ei ratkaissut ongelmaa, mutta
● se tukee paremmin näkyvyystulkintaa
Tämä on elegantti tapa ankkuroida teesi lain sanamuotoon.

6. Käytännön prosessikuva: virallistutkinta toimii vasta muutoksenhaussa
Yksi luvun ehkä kriittisimmistä havainnoista:
● käräjäoikeudessa virallistutkinta on usein automatisoitunutta ja pinnallista
● todellinen tutkiminen tapahtuu vasta:
● hovioikeudessa
● tai jopa KKO 2015:76 -tyyppisissä tapauksissa
→ järjestelmä toimii “väärin päin”:
● alioikeus ei tutki
● ylin oikeusaste tekee substanssiratkaisun
Kirjoittaja pitää tätä:
● prosessiekonomisesti huonona
● rakenteellisesti ongelmallisena

7. Kustannusvastuu – luvun ehkä terävin kritiikki
Luvun loppuosa osoittaa järjestelmän ehkä räikeimmän epäoikeudenmukaisuuden:
Tilanne:
● vastaaja on passiivinen
● tuomioistuin käynnistää laajan virallistutkinnan
● kantaja lopulta voittaa
→ vastaaja voi joutua maksamaan kustannuksia, joita:
● hän ei aiheuttanut
● hän ei voinut estää
Ratkaisussa KKO 2015:76 korkein oikeus:
● käytännössä loi uuden kohtuussäännön ilman selkeää lain tukea
Kirjoittajan arvio:
● lopputulos oikea
● perustelu heikko
● järjestelmä kaoottinen

8. Kokonaisarvio luvusta
Vahvuudet
1. Keskeinen oivallus (näkyvyyskriteeri)
– yksinkertaistaa koko doktriinia merkittävästi
2. Realismi
– tunnistaa resurssit, massamenettelyn ja käytännön rajoitteet
3. Systemaattinen analyysi
– historia → normi → käytäntö → politiikka
4. Kriittisyys
– ei idealisoi virallistutkintaa
Heikkoudet / avoimet kysymykset
1. Normatiivinen valinta jää osin implisiittiseksi
– pitäisikö painottaa enemmän vastaajan suojaa?
2. Vaihtoehtoiset ratkaisut jäävät kevyiksi
– esimerkiksi:
● laajempi haastehakemus
● automaattinen aineiston täydentäminen
● aktiivisempi tuomioistuin
3. AI-maininta jää pintapuoliseksi
– vaikka se voisi olla juuri tässä keskeinen kehityssuunta

9. Tiivistetty johtopäätös
Luvun ydinsanoma voidaan kiteyttää näin:
● Virallistutkinta ei ole sisällöllinen vaan havaintoon sidottu mekanismi
● Sen tehokkuus määräytyy aineiston laadun, ei normien perusteella
● Passiivisen vastaajan oikeussuoja on väistämättä puutteellinen
● Järjestelmä siirtää oikeussuojan painopistettä:
● joko vastaajan aktivaatioon
● tai jälkikäteisiin keinoihin
Samalla kirjoittaja tekee varsin rohkean implisiittisen väitteen: Summaarisen lainkäytön legitimiteetti on heikkenemässä, koska virallistutkinnalle on asetettu odotuksia, joita se ei voi täyttää.

Risto ja Markku Koulu

Aikaisempia blogiuutisia:
Keskusteluja tekoälyn kanssa – osa 1. Ilmestynyt 14.4.2025.
Keskusteluja tekoälyn kanssa – osa 3. Ilmestynyt 9.5.2025.
Summaarinen lainkäyttö tähtäimessä. Ilmestynyt 22.4.2026.

Kirjallisuutta:
Narayanan, Arvind – Kapoor, Sayash : AI Snake Oil. What Artificial
Intelligence Can Do, What it can’t, and How to Tell the Difference. Princeton
University Press 2024.

Asiasanat: tekoäly, tekoälyn käyttäminen, generoiva tekoäly, tutkimuseettiset standardit, tutkijan vastuu, tekijyyden kynnys, kustannustoimittajafiktio, tekoälyn luotettavuus

13.5.2026