Monen selittäjän regressiomenetelmien vertailu: Alzheimerin tautiin liittyvien veren proteiinien yhteys kognitioon
Hakala, Jasmine (2024-06-03)
Monen selittäjän regressiomenetelmien vertailu: Alzheimerin tautiin liittyvien veren proteiinien yhteys kognitioon
Hakala, Jasmine
(03.06.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024061250892
https://urn.fi/URN:NBN:fi-fe2024061250892
Tiivistelmä
Tutkielmassa tarkasteltiin Alzheimerin tautiin liittyvien veren beta-amyloidien 40 (A$\beta40$) ja 42 (A$\beta42$), hapan säikeisen gliaproteiinin (GFAP) sekä neurofilamentin kevytketjun (NfL) pitoisuuksien yhteyttä kognitiotestien tuloksiin terveillä henkilöillä. Yhteyttä tutkittiin vertailemalla erilaisia menetelmiä, jotka sopivat monen selittäjän tilanteeseen. Selittäjinä käytettiin yksittäisten kognitiotestien tuloksia. Menetelmiksi valikoitui osittaisen pienimmän neliösumman regressio, pääkomponentti-, LASSO- ja harjaregressio.
Osittaisen pienimmän neliösumman regressio ja pääkomponenttiregressio ovat dimension pienentämismenetelmiä, jotka muodostavat korreloimattomia komponentteja alkuperäisten selittäjien tilalle. Tämä vähentää selittäjien määrää ja pienentää korrelaatiota muuttujien välillä. LASSO- ja harjaregressio kutistavat regressiokertoimien suuruutta kohti nollaa, mikä pienentää kertoimien varianssia ja minimoi ennusteharhaa.
Tutkielmassa käytettiin Turun yliopiston Väestötutkimuskeskuksen Lasten Sepelvaltimotaudin Riskitekijät (LASERI) -tutkimuksen vuosina 2018—2020 kerättyä osakohorttia, johon kuului 814 iältään 59--88-vuotiasta henkilöä ($G_0$-sukupolvi) ja 1 237 heidän iältään 41–58-vuotiasta lastaan ($G_1$-sukupolvi). Aineistossa oli kultakin yksilöltä 68 kognitiivisen testin tulosta, verinäytteistä otetut proteiinipitoisuudet sekä taustamuuttujia, kuten sukupuoli, ikä, koulutusvuodet, nukutut tunnit ja vireystila.
Kognitiotestien ja proteiinipitoisuuksien yhteyttä tutkittiin $G_0$- ja $G_1$-sukupolvissa sekä yhdessä että erikseen. Tulokset osoittivat heikon yhteyden kognitiotestien ja proteiinien välillä $G_0$-sukupolven aineistossa. Sen sijaan $G_1$-sukupolven aineistossa kognitiotestien arvojen suurentuessa NfL-pitoisuus kasvaa, mutta GFAP-pitoisuus laskee. Koko aineistossa kognitiotestien arvojen kasvaessa NfL- ja GFAP-pitoisuudet kasvavat. Tulokset eivät kuitenkaan ole yksiselitteisiä, koska pääkomponenttien lataukset olivat sekä positiivisia että negatiivisia. Proteiinipitoisuuksien ja iän välinen yhteys oli selkeämpi ja ikääntyessä pitoisuudet kasvavat. Vertailun kohteena olleet menetelmät toimivat toisiinsa nähden yhtä hyvin.
Osittaisen pienimmän neliösumman regressio ja pääkomponenttiregressio ovat dimension pienentämismenetelmiä, jotka muodostavat korreloimattomia komponentteja alkuperäisten selittäjien tilalle. Tämä vähentää selittäjien määrää ja pienentää korrelaatiota muuttujien välillä. LASSO- ja harjaregressio kutistavat regressiokertoimien suuruutta kohti nollaa, mikä pienentää kertoimien varianssia ja minimoi ennusteharhaa.
Tutkielmassa käytettiin Turun yliopiston Väestötutkimuskeskuksen Lasten Sepelvaltimotaudin Riskitekijät (LASERI) -tutkimuksen vuosina 2018—2020 kerättyä osakohorttia, johon kuului 814 iältään 59--88-vuotiasta henkilöä ($G_0$-sukupolvi) ja 1 237 heidän iältään 41–58-vuotiasta lastaan ($G_1$-sukupolvi). Aineistossa oli kultakin yksilöltä 68 kognitiivisen testin tulosta, verinäytteistä otetut proteiinipitoisuudet sekä taustamuuttujia, kuten sukupuoli, ikä, koulutusvuodet, nukutut tunnit ja vireystila.
Kognitiotestien ja proteiinipitoisuuksien yhteyttä tutkittiin $G_0$- ja $G_1$-sukupolvissa sekä yhdessä että erikseen. Tulokset osoittivat heikon yhteyden kognitiotestien ja proteiinien välillä $G_0$-sukupolven aineistossa. Sen sijaan $G_1$-sukupolven aineistossa kognitiotestien arvojen suurentuessa NfL-pitoisuus kasvaa, mutta GFAP-pitoisuus laskee. Koko aineistossa kognitiotestien arvojen kasvaessa NfL- ja GFAP-pitoisuudet kasvavat. Tulokset eivät kuitenkaan ole yksiselitteisiä, koska pääkomponenttien lataukset olivat sekä positiivisia että negatiivisia. Proteiinipitoisuuksien ja iän välinen yhteys oli selkeämpi ja ikääntyessä pitoisuudet kasvavat. Vertailun kohteena olleet menetelmät toimivat toisiinsa nähden yhtä hyvin.