Mikrobiomiaineistojen analysointi CoDaCoRe-menetelmän avulla
Perasto, Laura (2023-05-27)
Mikrobiomiaineistojen analysointi CoDaCoRe-menetelmän avulla
Perasto, Laura
(27.05.2023)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2023053050582
https://urn.fi/URN:NBN:fi-fe2023053050582
Tiivistelmä
Mikrobiomiaineistot muodostuvat mikrobiominäytteissä havaittujen eri mikrobien lukumääristä. Aineistojen tyyppillisiä piirteitä ovat suuri dimensio, nollasolut sekä mikrobien lukumäärien jakaumien vinous. Lisäksi aineistojen voidaan ajatella olevan kompositionaalisia. Tämän tutkielman tavoitteena on esitellä vastikään julkaistu uusi menetelmä mikrobiomiaineistojen analysointiin, CoDaCoRe. CoDaCoRe-menetelmän tarkoituksena on tunnistaa mahdollisimman vähälukuiset (eli "harvat") kaksi mikrobien osajoukkoa, jotka ennustavat valittua vastemuuttujaa parhaiten. Optimaaliset osajoukot määritetään aineiston perusteella joko ns. balanssien tai yhdelmien avulla. Balanssit ja yhdelmät määritellään kahteen osajoukkoon kuuluvien mikrobien havaittujen lukumäärien suhteina.
Tutkielman alussa kuvataan, kuinka mikrobiomiaineistot muodostuvat sekä niiden erityispiirteitä ja haasteita. Lisäksi esitellään mikrobikoostumuksen monimuotoisuutta kuvaavia indeksejä sekä sitä, miten biomarkkereita eli biologista ilmiötä ennustavia mikrobeja voidaan tunnistaa. CoDaCoRe-menetelmän vaiheet esitellään ensin teoreettisesti. Tämän jälkeen menetelmää sovelletaan mikrobiomiaineistoon, joka on kerätty FinnBrain-syntymäkohorttitutkimuksessa 2.5 kuukauden ikäisiltä vauvoilta. CoDaCoRe-menetelmän avulla voidaan tutkia sekä binääristä että jatkuvaa vastemuuttujaa. Binäärisenä eli kaksiarvoisena vasteena käytetään synnytystapaa (alatiesynnytys vs. sektio). Jatkuvana vastemuuttujana käytetään 30 kuukautisten lasten silmänliikkeemittauksista johdettua muuttujaa, joka mittaa, kuinka usein lapsi käänsi katseensa pois pelokkaista kasvokuvista.
Tutkielman tulosten perusteella alatiesynnyttäneet ja sektiolla synnyttäneet erosivat toisistaan selkeästi löydettyjen osajoukkojen suhteen. Myös silmänliikemmuuttujan tapauksessa tunnistettiin osajoukkoja, jotka pystyivät ennustamaan vastemuuttujaa. Sekä binäärisen että jatkuvan vastemuuttujan kohdalla tutkittiin, miten hyvin tunnistetut osajoukot ennustivat uusia havaintoja. Yhdelmien ennustuskyky oli vain hieman parempi verrattuna balansseihin. Sensitiivisyysanalyysina tarkasteltiin optimointialgoritmin tarvitseman siemenluvun vaikutusta löydettyihin osajoukkoihin. Valitulla siemenluvulla oli vaikusta löydettyjen osajoukkojen sisältämiin mikrobeihin.
Tutkielman alussa kuvataan, kuinka mikrobiomiaineistot muodostuvat sekä niiden erityispiirteitä ja haasteita. Lisäksi esitellään mikrobikoostumuksen monimuotoisuutta kuvaavia indeksejä sekä sitä, miten biomarkkereita eli biologista ilmiötä ennustavia mikrobeja voidaan tunnistaa. CoDaCoRe-menetelmän vaiheet esitellään ensin teoreettisesti. Tämän jälkeen menetelmää sovelletaan mikrobiomiaineistoon, joka on kerätty FinnBrain-syntymäkohorttitutkimuksessa 2.5 kuukauden ikäisiltä vauvoilta. CoDaCoRe-menetelmän avulla voidaan tutkia sekä binääristä että jatkuvaa vastemuuttujaa. Binäärisenä eli kaksiarvoisena vasteena käytetään synnytystapaa (alatiesynnytys vs. sektio). Jatkuvana vastemuuttujana käytetään 30 kuukautisten lasten silmänliikkeemittauksista johdettua muuttujaa, joka mittaa, kuinka usein lapsi käänsi katseensa pois pelokkaista kasvokuvista.
Tutkielman tulosten perusteella alatiesynnyttäneet ja sektiolla synnyttäneet erosivat toisistaan selkeästi löydettyjen osajoukkojen suhteen. Myös silmänliikemmuuttujan tapauksessa tunnistettiin osajoukkoja, jotka pystyivät ennustamaan vastemuuttujaa. Sekä binäärisen että jatkuvan vastemuuttujan kohdalla tutkittiin, miten hyvin tunnistetut osajoukot ennustivat uusia havaintoja. Yhdelmien ennustuskyky oli vain hieman parempi verrattuna balansseihin. Sensitiivisyysanalyysina tarkasteltiin optimointialgoritmin tarvitseman siemenluvun vaikutusta löydettyihin osajoukkoihin. Valitulla siemenluvulla oli vaikusta löydettyjen osajoukkojen sisältämiin mikrobeihin.