Taloustekstien konekäännösten laadun arviointi saksasta suomeen käännettäessä : Esimerkkinä DeepL-käännin
Dalfors, Irina (2024-10-08)
Taloustekstien konekäännösten laadun arviointi saksasta suomeen käännettäessä : Esimerkkinä DeepL-käännin
Dalfors, Irina
(08.10.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024111290975
https://urn.fi/URN:NBN:fi-fe2024111290975
Tiivistelmä
Nykyään neuroverkkokääntimien, kuten DeepL:n, käyttö on yleistynyt sekä maallikoiden että ammattikääntäjien keskuudessa. DeepL on noussut merkittäväksi toimijaksi konekääntämisen alalla ja ansainnut mainetta kyvystään tuottaa suhteellisen laadukkaampia ja sujuvampia käännöksiä, erityisesti yleisluontoisista teksteistä. DeepL-kääntimen käännöksiä on tarkasteltu useissa tutkimuksissa. Tulokset ovat osoittaneet, että vaikka DeepL-käännökset voivat olla kieliopillisesti oikeita, sujuvia ja usein jopa loogisia, niissä voi olla puutteita erikoisalan termeissä ja monimerkityksissä sanoissa.
DeepL-käännökset eivät näin ollen aina luotettavia, ja niiden käytössä on tärkeää tarkkailla laatua. Tässä tutkimuksessa keskityttiin DeepL-konekäännöksen laadun arviointiin erityisesti saksasta suomeen käännettäessä. Aineistona käytettiin talousaiheisia tekstikatkelmia, ja niiden laatua analysoitiin manuaalisesti moniulotteisen ja standardoidun MQM-käännöslaatumittarin avulla. MQM-mittarin virhekategorioista analysoitavaksi valittiin ainoastaan tutkimuksen kannalta relevantit kategoriat: tarkkuus, sujuvuus ja terminologia. Näiden kategorioiden avulla tarkasteltiin virheitä tyypeittäin ja määriteltiin virheiden vakavuusasteet, ja lopulta laskettiin laatupistemäärä numeerisesti.
Tutkimuksen tarkoituksena oli selvittää, minkälaisia tarkkuuteen, sujuvuuteen ja terminologiaan liittyviä virheitä esiintyy konekäännöksessä ja minkälainen vaikutus niillä on lauseiden semanttisen merkityksen välittymiseen. Konekäännösten tulosta vertailtiin vielä ihmisen tekemän käännöksen kanssa, jotta saataisiin selville, minkälaisia eroja niiden välillä esiintyy. Tulokset osoittivat, että DeepL-käännös ei ollut virheetön: Eniten virheitä esiintyi tarkkuuden kategoriassa ja sujuvuuden kategoriassa, kun taas terminologiassa virheitä oli vähiten. DeepL-käännöksen virheet eivät olleet kriittisiä, ja ne eivät johtaneet koko käännöksen hylkäämiseen. Vakavuusasteiltaan virheet olivat joko merkittäviä tai vähäisiä, ja ne vaikeuttivat pääasiassa semanttisen merkityksen välittämistä. Aineiston analyysin perusteella päädyttiin tulokseen, että DeepL-käännin ei vielä ole ihmiskääntäjän kanssa samalla tasolla tietokirjojen tekstien kääntämisessä. Vaikka DeepL-käännökset tarjoavat hyvän lähtökohdan käännöstyölle, ne tarvitsevat edelleen jälkieditointia ennen julkaisua.
DeepL-käännökset eivät näin ollen aina luotettavia, ja niiden käytössä on tärkeää tarkkailla laatua. Tässä tutkimuksessa keskityttiin DeepL-konekäännöksen laadun arviointiin erityisesti saksasta suomeen käännettäessä. Aineistona käytettiin talousaiheisia tekstikatkelmia, ja niiden laatua analysoitiin manuaalisesti moniulotteisen ja standardoidun MQM-käännöslaatumittarin avulla. MQM-mittarin virhekategorioista analysoitavaksi valittiin ainoastaan tutkimuksen kannalta relevantit kategoriat: tarkkuus, sujuvuus ja terminologia. Näiden kategorioiden avulla tarkasteltiin virheitä tyypeittäin ja määriteltiin virheiden vakavuusasteet, ja lopulta laskettiin laatupistemäärä numeerisesti.
Tutkimuksen tarkoituksena oli selvittää, minkälaisia tarkkuuteen, sujuvuuteen ja terminologiaan liittyviä virheitä esiintyy konekäännöksessä ja minkälainen vaikutus niillä on lauseiden semanttisen merkityksen välittymiseen. Konekäännösten tulosta vertailtiin vielä ihmisen tekemän käännöksen kanssa, jotta saataisiin selville, minkälaisia eroja niiden välillä esiintyy. Tulokset osoittivat, että DeepL-käännös ei ollut virheetön: Eniten virheitä esiintyi tarkkuuden kategoriassa ja sujuvuuden kategoriassa, kun taas terminologiassa virheitä oli vähiten. DeepL-käännöksen virheet eivät olleet kriittisiä, ja ne eivät johtaneet koko käännöksen hylkäämiseen. Vakavuusasteiltaan virheet olivat joko merkittäviä tai vähäisiä, ja ne vaikeuttivat pääasiassa semanttisen merkityksen välittämistä. Aineiston analyysin perusteella päädyttiin tulokseen, että DeepL-käännin ei vielä ole ihmiskääntäjän kanssa samalla tasolla tietokirjojen tekstien kääntämisessä. Vaikka DeepL-käännökset tarjoavat hyvän lähtökohdan käännöstyölle, ne tarvitsevat edelleen jälkieditointia ennen julkaisua.