Aktivointifunktioiden vaikutus neuroverkkojen suorituskykyyn
Leino, Aaron (2024-12-12)
Aktivointifunktioiden vaikutus neuroverkkojen suorituskykyyn
Leino, Aaron
(12.12.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe20241219104846
https://urn.fi/URN:NBN:fi-fe20241219104846
Tiivistelmä
Tutkielma tarkastelee neuroverkkojen aktivointifunktioiden ominaisuuksia ja niiden vaikutusta neuroverkon oppimisprosessiin. Tarkastelu keskittyy sigmoid-, hyperbolinen tangentti- ja ReLU-funktioihin, jotka ovat yleisesti käytettyjä aktivaatiomekanismeja neuroverkoissa.
Aluksi tutkielmassa esitellään neuroverkkojen rakenne ja historia, minkä jälkeen siirrytään neuroverkkojen oppimisprosessin tarkasteluun. Seuraavaksi analysoidaan aktivointifunktioiden suotuisia ja epäsuotuisia ominaisuuksia, erityisesti optimoinnin näkökulmasta. Lopuksi käsitellään tarkemmin sigmoid-, hyperbolinen tangentti- ja ReLU-funktiot, ja toteutetaan esimerkki lämpötilan ennustamisesta eteenpäin kytketyllä neuroverkolla, jossa verrataan eri aktivointifunktioiden vaikutuksia. Esimerkistä käy ilmi, että ReLU on tehokkain ja tarkin aktivointifunktio, kun taas hyperbolinen tangentti ja sigmoid vaativat pidemmän koulutusajan saavuttaakseen vastaavan ennustustarkkuuden.
Tutkielman tulokset osoittavat, että aktivointifunktion valinnalla on merkittävä vaikutus neuroverkon suorituskykyyn.
Aluksi tutkielmassa esitellään neuroverkkojen rakenne ja historia, minkä jälkeen siirrytään neuroverkkojen oppimisprosessin tarkasteluun. Seuraavaksi analysoidaan aktivointifunktioiden suotuisia ja epäsuotuisia ominaisuuksia, erityisesti optimoinnin näkökulmasta. Lopuksi käsitellään tarkemmin sigmoid-, hyperbolinen tangentti- ja ReLU-funktiot, ja toteutetaan esimerkki lämpötilan ennustamisesta eteenpäin kytketyllä neuroverkolla, jossa verrataan eri aktivointifunktioiden vaikutuksia. Esimerkistä käy ilmi, että ReLU on tehokkain ja tarkin aktivointifunktio, kun taas hyperbolinen tangentti ja sigmoid vaativat pidemmän koulutusajan saavuttaakseen vastaavan ennustustarkkuuden.
Tutkielman tulokset osoittavat, että aktivointifunktion valinnalla on merkittävä vaikutus neuroverkon suorituskykyyn.