Selitettävä tekoäly luonnollisen kielen käsittelyssä ja kuvantunnistuksessa
Myntti, Amanda (2023-06-12)
Selitettävä tekoäly luonnollisen kielen käsittelyssä ja kuvantunnistuksessa
Myntti, Amanda
(12.06.2023)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2023061454952
https://urn.fi/URN:NBN:fi-fe2023061454952
Tiivistelmä
Tutkielmassa tutustutaan koneoppimismallien selitettävyyteen ja selitettävään tekoälyyn (eng.explainability, explainable AI, XAI ) ohjatun oppimisen kontekstissa. Selitettävyyttä lähestytään sekä kvalitatiivisesti että matemaattisesta näkökulmasta, painottuen erityisesti post-hoc tyylisiin lokaaleihin selityksiin lajittelumalleissa. Lisäksi tarkastellaan luonnollisen kielen käsittelyn (eng.natural language processing, NLP ) sovellusta, jossa selitysalgoritmia käytetään uuden tiedon eristämiseen tekstiaineistosta.
Tutkielma alkaa kirjallisuuskatsauksella selitettävien koneoppimismallien historiaan, erilaisiin selityskategorioihin ja nykyajan tarpeisiin luoda selitettäviä koneoppimismalleja sekä selittää jo olemassaolevia malleja. Seuraavaksi määritellään ohjatun oppimisen terminologiaa ja neuroverkkojen toiminnan perusteet sekä käsitellään luonnollisen kielen käsitellyssä käytettyjen mallien toimintaa.
Teoriapohjan rakentamisen jälkeen määritellään kolme erilaista lokaalia post-hoc selitysmenelmää, kerroksittainen relevanssi (eng.Layerwise Relevance Propagation), integroidut gradientit (eng. Integrated Gradients) sekä peittoanalyysi (eng.Occlusion Analysis). Lopuksi tarkastellaan sovellusta, jossa integroidut gradientit -selitysmenetelmää käytetään monirekisterisen tekstiaineiston avainsanojen määrittelemiseen rekistereittäin.
Tutkielma alkaa kirjallisuuskatsauksella selitettävien koneoppimismallien historiaan, erilaisiin selityskategorioihin ja nykyajan tarpeisiin luoda selitettäviä koneoppimismalleja sekä selittää jo olemassaolevia malleja. Seuraavaksi määritellään ohjatun oppimisen terminologiaa ja neuroverkkojen toiminnan perusteet sekä käsitellään luonnollisen kielen käsitellyssä käytettyjen mallien toimintaa.
Teoriapohjan rakentamisen jälkeen määritellään kolme erilaista lokaalia post-hoc selitysmenelmää, kerroksittainen relevanssi (eng.Layerwise Relevance Propagation), integroidut gradientit (eng. Integrated Gradients) sekä peittoanalyysi (eng.Occlusion Analysis). Lopuksi tarkastellaan sovellusta, jossa integroidut gradientit -selitysmenetelmää käytetään monirekisterisen tekstiaineiston avainsanojen määrittelemiseen rekistereittäin.