Datan augmentoinnin menetelmien vertailu kuvadatalla

Honkanen, Jaakko

Datan augmentoinnin menetelmien vertailu kuvadatalla

Honkanen, Jaakko (2021-10-28)

Datan augmentoinnin menetelmien vertailu kuvadatalla

Honkanen, Jaakko

(28.10.2021)

Katso/Avaa

Honkanen_Jaakko_opinnayte.pdf (798.0Kb)

Lataukset:

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

avoin

Näytä kaikki kuvailutiedot

Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2021112957730

Tiivistelmä

Datan augmentointi on keino parantaa koneoppimismallin kykyä suoriutua tehtävästä,
jota varten se on opetettu. Data-augmentoinnin pääasiallinen tarkoitus on parantaa mallin
yleistyvyyttä eli kykyä suoriutua sellaisen datan käsittelemisestä, jota ei ole
opetusdatassa.

Tässä tutkielmassa vertaillaan eräitä datan augmentointimenetelmiä kuvamuotoiseen
dataan sovellettuna. Tutkielmassa vertaillaan keskenään tyylinsiirto neuroverkolla -
menetelmää sekä generatiivisiin kilpaileviin verkostoihin (GAN) perustuvia menetelmiä.
Lisäksi tutkitaan niiden menetelmien käyttöä perinteisten, yksinkertaisempien datan
augmentointimenetelmien rinnalla.

Data-augmentointimenetelmiä vertaillaan sen perusteella, kuinka paljon ne parantavat
tarkkuutta kuvien luokittelutehtävissä. Tutkielmassa tutkitaan, miten hyvin
generatiivisiin kilpaileviin verkostoihin perustuva datan augmentointi ja tyylinsiirtoon
perustuva datan augmentointi suoriutuvat suhteessa perinteisiin
augmentointimenetelmiin, ja miten ne muuttavat tilannetta verrattuna siihen, että ei
käytettäisi augmentointia. Tutkielmassa käytetty data rajoittuu enimmäkseen
kasvokuviin.

Kokeissa mitattujen luokittelun tarkkuustulosten perusteella todetaan, että generatiivisilla
kilpailevilla verkostoilla sekä tyylinsiirrolla tehdyllä datan augmentoinnilla saavutetaan
joissakin tapauksissa pieniä, mutta merkittäviä parannuksia. Todetaan myös, että
tutkielmassa käytettyyn dataan generatiivisilla kilpailevilla verkostoilla tehty
augmentointi sopii yleensä paremmin kuin tyylinsiirto ja perinteiset datan augmentoinnin
menetelmät.

Kokoelmat

Pro gradu -tutkielmat ja diplomityöt sekä syventävien opintojen opinnäytetyöt (kokotekstit) [8547]