Generatiivisella tekoälyllä toimivien kuvageneraattoreiden ongelmat kuvien generoinnissa
Naula, Roosa (2024-06-20)
Generatiivisella tekoälyllä toimivien kuvageneraattoreiden ongelmat kuvien generoinnissa
Naula, Roosa
(20.06.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024062558280
https://urn.fi/URN:NBN:fi-fe2024062558280
Tiivistelmä
Kuvageneraattorit ovat kasvattaneet suosiotaan huimasti viime vuosien aikana. Kuvageneraattorit ovat hämmästyttävän hyviä luomaan aidon näköisiä kuvia. Monesti generoituja kuvia on vaikea erottaa aidoista valokuvista. Kuvageneraattorit ovat kuitenkin alttiita tietyille virheille, joista generoidut kuvat voi tunnistaa. Tässä kandidaatintutkielmassa tutustutaan generatiivisella tekoälyllä toimivien kuvageneraattoreiden toimintaan. Aluksi käydään läpi keskeisiä käsitteitä liittyen tekoälyyn. Tämän jälkeen tutustutaan siihen, miten kuvageneraattorit konkreettisesti toimivat. Kuvageneraattorin rakenne jaetaan eri osa-alueisiin. Näitä osa-alueita tarkastellaan yksityiskohtaisemmin Stable Diffusionin rakennetta tarkastelemalla. Tutkielmassa esitellään erilaisia virheitä, jotka esiintyvät generoiduissa kuvissa. Tutkielmassa pohditaan millaisia ongelmia ja puutteita piilee näiden virheiden takana. Kuvageneraattorit tekevät eniten virheitä ihmisten kuvaamisessa, joten tutkielmassa keskitytään ihmisten kuvantamisen ongelmaan. Tutkielmassa tarkastellaan myös kehotteiden merkitystä generoimisprosessin ohjaajina. Kehotteiden hallinta on tärkeää, jos haluaa generoida laadukkaita kuvia. Tutkielmassa nostetaan esiin arkijärjen puute kuvageneraattoreissa. Arkijärjen mallinnus ratkaisisi luultavasti monet kuvien generoimiseen liittyvät ongelmat. Lopuksi pohditaan mikä on se kaikista kriittisin asia, josta monet virheet johtuvat, ja onko kattavan arkijärjen mallintaminen mahdollista.