Puuttuvat arvot havaintojoukossa
Rinne, Ville (2018-04-30)
Puuttuvat arvot havaintojoukossa
Rinne, Ville
(30.04.2018)
Tätä artikkelia/julkaisua ei ole tallennettu UTUPubiin. Julkaisun tiedoissa voi kuitenkin olla linkki toisaalle tallennettuun artikkeliin / julkaisuun.
Turun yliopisto
Tiivistelmä
Tutkielmassa käsitellään havaintomatriisissa esiintyviä puuttuvia arvoja. Havaintomatriisin vaakarivit merkitsevät havaintoyksilöitä ja pystyrivit muuttujia, joiden arvot on kirjattu ylös eri havaintoyksilöiltä. Syystä tai toisesta joidenkin muuttujien arvoja ei ole saatu kirjattua ylös kaikilta yksilöiltä. Tutkielman alussa käsitellään puuttuvien arvojen eri ilmenemismuotoja sekä havaintojoukkoon liittyviä oletuksia. Määritellään MAR-oletus eli satunnainen puuttuvuus sekä sen merkitys havainto-joukosta tehtäviin päätelmiin. Esitetään myös multinomimalli ja sen ominaisuuksia.
Seuraavaksi esitellään EM-algoritmi puuttuvien arvojen käsittelyyn. EM-algoritmia kuvataan ensin yleisesti ja multinomimalliin sovellettuna.
Seuraavassa kappaleessa käsitellään faktorianalyysia. Aluksi selitetään yleisesti fak-torianalyysin merkitystä ja esitetään faktorianalyysin malli. Sen jälkeen käsitellään faktoripisteitä ja miten ne lasketaan.
Lopuksi esitellään tutkittava aineisto. Aineisto on Finn-Brain tutkimukseen liittyvä PRAQ-kysely, jolla mitataan raskauden aikaan ja synnytykseen liittyvää stressiä. Aineistossa on puuttuvia arvoja, joita paikataan EM-algoritmilla. Paikatulle aineistolle suoritetaan faktorianalyysi, josta saatuja faktoripisteitä verrataan havaintoyksilöiden eri ryhmien välillä. Tuloksia verrataan tapauksenpoistolla luodulle havaintojoukolle suoritettuun faktorianalyysiin.
Seuraavaksi esitellään EM-algoritmi puuttuvien arvojen käsittelyyn. EM-algoritmia kuvataan ensin yleisesti ja multinomimalliin sovellettuna.
Seuraavassa kappaleessa käsitellään faktorianalyysia. Aluksi selitetään yleisesti fak-torianalyysin merkitystä ja esitetään faktorianalyysin malli. Sen jälkeen käsitellään faktoripisteitä ja miten ne lasketaan.
Lopuksi esitellään tutkittava aineisto. Aineisto on Finn-Brain tutkimukseen liittyvä PRAQ-kysely, jolla mitataan raskauden aikaan ja synnytykseen liittyvää stressiä. Aineistossa on puuttuvia arvoja, joita paikataan EM-algoritmilla. Paikatulle aineistolle suoritetaan faktorianalyysi, josta saatuja faktoripisteitä verrataan havaintoyksilöiden eri ryhmien välillä. Tuloksia verrataan tapauksenpoistolla luodulle havaintojoukolle suoritettuun faktorianalyysiin.