Ihmishahmo seisomassa futuristisen näköisessä huoneessa, jossa on tietokoneita

Tekoäly kääntää termit epäjohdonmukaisesti – miksi?

Kirjoittaja Karoliina Rinne

Käännösten tekeminen konekääntimien ja generatiivisen tekoälyn avulla on yleistynyt valtavasti etenkin viime vuoden aikana. Kone kääntää suuriakin tekstimassoja nopeasti (ja lähes ilmaiseksi).

Yksi silmiinpistävimmistä – ja raivostuttavimmista – ongelmista on se, että kone ei osaa yhtenäistää termejä ja käsitteitä tekstissä, vaan pahimmillaan virkkeet ovat täysin irrallisia toisistaan.

Tässä Tekstiräätälien blogiartikkelissa esittelen muutaman esimerkin ilmiöstä ja kerron, mistä se johtuu. Annan myös muutaman helpon vinkin koneen kääntämien tekstien tarkistamiseen.

Tekoäly arpoo termejä ja sanoja käännöksiin

Konekääntimet ja tekoäly kääntävät tekstejä niin, että ne laskevat todennäköisyyksiä sille, mikä sana seuraa (yleensä) toista sanaa. Koska samasta asiasta voidaan käyttää useita eri termejä tai nimityksiä, kone ikään kuin arpoo, mikä niistä milloinkin olisi todennäköisin vaihtoehto.

Kone ei osaa hahmottaa tekstikokonaisuutta tai kontekstia eli asiayhteyttä. Niinpä tekstiin tupsahtelee vaihtelevasti eri sanoja ja käsitteitä samalle asialle: kun ensimmäisessä virkkeessä on lukenut konserni, toisessa lukeekin yhtymä ja kolmannessa Group. Toisessa tekstissä taas ”car” on vaihtelevasti joko auto tai ajoneuvo. Kaikki ne toki ovat oikein – asiayhteydestä riippuen. Samassa tekstissä ja peräkkäin käytettynä ne kuitenkin luovat kummallisen vaikutelman ja hankaloittavat sisällön ymmärtämistä.

Kone ei ymmärrä tekstin punaista lankaa

Kun tekstiä kirjoittaa (tai kääntää) ihminen, yhtenä ohjaavana periaatteena voidaan pitää koheesiota eli sidosteisuutta. Tekstin pitää edetä loogisesti ja samoihin asioihin pitää viitata samalla tavalla. Tekstissä pitää olla punainen lanka, jotta se on ymmärrettävä.

Kone on helposti pulassa, kun se kääntää esimerkiksi englannin you-sanaa. Sinä vai te? Tahattoman humoristisen vaikutelman luo se, jos yhdessä virkkeessä todetaan, että voitte nyt hyödyntää uutta palveluamme, ja seuraavassa, että näin sinä pääset helpommalla. Kuka, mitä, häh?

Tekoälyn termituska

Varsinaisten termien luulisi olevan tekoälyn ja konekääntimen leipälaji. Väärin luultu. Tekoälyn koulutuksessa käytettävät valtavatkaan tekstimassat eivät takaa, että termit menevät nappiin. Koneille on nimittäin syötetty netin syövereistä kaikki mahdollinen tekstimassa virheineen päivineen.

Huolestuttavin esimerkki omissa toimeksiannoissani on ollut koneen tekemä virhe tietosuojatermeihin liittyen: ”data controllerista” tulee usein tietojenkäsittelijä, vaikka sen ainoa ja oikea tietosuoja-asetuksen mukainen vastine on rekisterinpitäjä. Välillä rekisterinpitäjä menee kuitenkin oikein.

Jos niinkin yleinen termi kuin ”data controller” kääntyy koneen käsittelyssä vaihtelevasti, alakohtaisista erikoistermeistä lienee turha mainita mitään.

Mistä termien epäjohdonmukaisuus konekäännöksissä johtuu?

Mikäpä olisi parempi taho vastaamaan, miksi konekääntimet tai tekoäly kääntävät termit miten sattuu, kuin kone itse. Kysyin asiaa ChatGPT:ltä ja sain syiksi termien monitulkintaisuuden, kielten monimuotoisuuden, vaihtelevan laatuiset käännösalgoritmit ja kulttuuriset erot.

ChatGPT totesi: ”Kaikki nämä tekijät yhdessä voivat johtaa siihen, että konekäännösten laatu vaihtelee ja että samat termit käännetään eri tavoin eri yhteyksissä. Parantaakseen käännösten yhdenmukaisuutta ja laatua konekääntimet tarvitsevat jatkuvaa kehitystä ja hienosäätöä.”

Täsmätärpit termien yhdenmukaisuuden tarkistamiseen

Jos muokkaat työssäsi koneen tekemiä käännöksiä, tässä sinulle parin kohdan tarkistuslista työn avuksi:

  • Älä luota, että kone on kääntänyt termit oikein – edes kerran saati kauttaaltaan. Joskus kone löytää oikean termin ihmistä paljon nopeammin. Aina se ei kuitenkaan mene oikein, eikä yksi oikein tuo vielä täyttä lottoriviä. Epäile ja tarkista.
  • Huomaa, että kone kääntää epäjohdonmukaisesti myös tavalliset yleissanat, kuten konserni ja auto. Tarkista tekstin tärkeimmät yleissanat edes mekaanisesti. Käytä hakutoimintoa (Ctrl+F).
  • Tarkista tekstin persoonapronominit ja sinuttelu/teitittely. You on koneelle hankala. (Sama ilmiö näkyy myös ruotsissa, vaikka pronominit ovat du/ni.)

Tutustu kielioptimointipalveluun

Käytetäänkö yrityksessäsi tekoälyä markkinoinnin kääntämisessä tai sisällöntuotannossa? Kaipaavatko tekstinne ihmisen kosketusta? Lue lisää Tekstiräätälien kielioptimointipalvelusta!

Kysy lisää

Tekstiräätälit on kääntämisen asiantuntija, jotta sinun ei tarvitsisi olla. Me pystymme tekemään johdonmukaisia ja suomalaisen kuuloisia käännöksiä – joko tekoälyn avulla tai ilman. Soita minulle tai lähetä sähköpostia, niin jutellaan: 050 576 9794, karoliina@tekstiraatalit.fi.