Datan augmentoinnin menetelmien vertailu kuvadatalla
Honkanen, Jaakko (2021-10-28)
Datan augmentoinnin menetelmien vertailu kuvadatalla
Honkanen, Jaakko
(28.10.2021)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2021112957730
https://urn.fi/URN:NBN:fi-fe2021112957730
Tiivistelmä
Datan augmentointi on keino parantaa koneoppimismallin kykyä suoriutua tehtävästä,
jota varten se on opetettu. Data-augmentoinnin pääasiallinen tarkoitus on parantaa mallin
yleistyvyyttä eli kykyä suoriutua sellaisen datan käsittelemisestä, jota ei ole
opetusdatassa.
Tässä tutkielmassa vertaillaan eräitä datan augmentointimenetelmiä kuvamuotoiseen
dataan sovellettuna. Tutkielmassa vertaillaan keskenään tyylinsiirto neuroverkolla -
menetelmää sekä generatiivisiin kilpaileviin verkostoihin (GAN) perustuvia menetelmiä.
Lisäksi tutkitaan niiden menetelmien käyttöä perinteisten, yksinkertaisempien datan
augmentointimenetelmien rinnalla.
Data-augmentointimenetelmiä vertaillaan sen perusteella, kuinka paljon ne parantavat
tarkkuutta kuvien luokittelutehtävissä. Tutkielmassa tutkitaan, miten hyvin
generatiivisiin kilpaileviin verkostoihin perustuva datan augmentointi ja tyylinsiirtoon
perustuva datan augmentointi suoriutuvat suhteessa perinteisiin
augmentointimenetelmiin, ja miten ne muuttavat tilannetta verrattuna siihen, että ei
käytettäisi augmentointia. Tutkielmassa käytetty data rajoittuu enimmäkseen
kasvokuviin.
Kokeissa mitattujen luokittelun tarkkuustulosten perusteella todetaan, että generatiivisilla
kilpailevilla verkostoilla sekä tyylinsiirrolla tehdyllä datan augmentoinnilla saavutetaan
joissakin tapauksissa pieniä, mutta merkittäviä parannuksia. Todetaan myös, että
tutkielmassa käytettyyn dataan generatiivisilla kilpailevilla verkostoilla tehty
augmentointi sopii yleensä paremmin kuin tyylinsiirto ja perinteiset datan augmentoinnin
menetelmät.
jota varten se on opetettu. Data-augmentoinnin pääasiallinen tarkoitus on parantaa mallin
yleistyvyyttä eli kykyä suoriutua sellaisen datan käsittelemisestä, jota ei ole
opetusdatassa.
Tässä tutkielmassa vertaillaan eräitä datan augmentointimenetelmiä kuvamuotoiseen
dataan sovellettuna. Tutkielmassa vertaillaan keskenään tyylinsiirto neuroverkolla -
menetelmää sekä generatiivisiin kilpaileviin verkostoihin (GAN) perustuvia menetelmiä.
Lisäksi tutkitaan niiden menetelmien käyttöä perinteisten, yksinkertaisempien datan
augmentointimenetelmien rinnalla.
Data-augmentointimenetelmiä vertaillaan sen perusteella, kuinka paljon ne parantavat
tarkkuutta kuvien luokittelutehtävissä. Tutkielmassa tutkitaan, miten hyvin
generatiivisiin kilpaileviin verkostoihin perustuva datan augmentointi ja tyylinsiirtoon
perustuva datan augmentointi suoriutuvat suhteessa perinteisiin
augmentointimenetelmiin, ja miten ne muuttavat tilannetta verrattuna siihen, että ei
käytettäisi augmentointia. Tutkielmassa käytetty data rajoittuu enimmäkseen
kasvokuviin.
Kokeissa mitattujen luokittelun tarkkuustulosten perusteella todetaan, että generatiivisilla
kilpailevilla verkostoilla sekä tyylinsiirrolla tehdyllä datan augmentoinnilla saavutetaan
joissakin tapauksissa pieniä, mutta merkittäviä parannuksia. Todetaan myös, että
tutkielmassa käytettyyn dataan generatiivisilla kilpailevilla verkostoilla tehty
augmentointi sopii yleensä paremmin kuin tyylinsiirto ja perinteiset datan augmentoinnin
menetelmät.