Pistepilvien tehokas yhdistäminen
Saukkio, Teemu (2024-03-25)
Pistepilvien tehokas yhdistäminen
Saukkio, Teemu
(25.03.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024032813538
https://urn.fi/URN:NBN:fi-fe2024032813538
Tiivistelmä
Pistejoukko on eräs yleinen fyysistä ympäristöä kuvaava datatyyppi, joka tuotetaan monilla erilaisilla sensoreilla ja tekniikoilla, tai niiden yhdistelmällä. Eräs yleinen ongelma on erillisten pistejoukkojen yhdistäminen. Tällöin keskeisiä ongelmia ovat yksittäisten pisteiden pariuttaminen sillä oletuksella, että kullakin pisteellä on tietty identiteetti samalla kun pisteillä on myös tietty lähes vakio sijaintitarkkuus ja vaihteleva keskinäinen tiheys. On huomattava, että oletus pisteiden identiteetistä eri pistejoukoissa vaatii käytetyiltä tekniikoilta sen, että suuri osa pisteistä, ns. kiintopisteistä, edustaa jotain tunnistettua piirrettä maailmasta.
Tässä tutkimuksessa tarkastellaan pistejoukkojen pariutusongelmaa. Käytetyt pistejoukot ovat tutkimuksen piirissä tuotettu synteettisesti tai ovat peräisin metsäalueelta saadusta mittausaineistosta. Ratkaistujen pariutusten avulla voidaan löytää ongelmaan vaikuttavia muuttujia tai luoda laajempia pistejoukkoja yhdistämällä osittain päällekkäisiä joukkoja toisiinsa. Tutkimuksen aikana tarkasteltiin koordinaatiston valinnan vaikutusta, kun parien oletetaan olevan lähin kohdejoukon piste, sekä tapoja suodattaa tulosjoukosta selkeästi vääriä tuloksia. Tarkasteltiin myös pariutusongelman kuvantamiseen soveltuvia menetelmiä ja niiden mahdollisuuksia pariutusongelmien vaikeuden ja tuloksen oikeellisuuden arviointiin.
Tutkimuksen tuloksena havaittiin helpohkojen pariutusongelmien olevan tunnistettavissa, jonka jälkeen ongelman ratkaisuun voidaan hyödyntää laskennallisesti kevyitä menetelmiä hyvän lopputuloksen aikaansaamiseksi. Näissä tapauksissa pariutuksen tarkkuus on käytännössä riittävä, ja laskenta erittäin nopea tutkimuksessa käsitellyin menetelmin. Esitetyt menetelmät eivät ratkaise vaikeampia ongelmia, mutta toisaalta nämä voidaan tunnistaa, ja vaikeiden ongelmien tapauksessa on mahdollista joko rajoittaa pisteiden tiheyttä valitsemalla vain varmimpia ja selkeimpiä kiintopisteitä, tai käyttämällä parhaillaan kehittyviä joustavan sovittamisen menetelmiä, jotka ovat hivenen kalliimpia laskennallisesti.
Omana kappaleenaan esitetään tekoälymenetelmien soveltamista pistepilvien pariuttamisessa. Tekoälyn soveltamista varten muodostetaan käytettävissä oleva data koneoppimistarkoituksiin soveltuvaan muotoon, joka mahdollistaa menetelmien hyödyntämisen pariutustehtävässä. Lisäksi testataan ongelmaan sopivien koneoppimismallien suorituskykyä tutkimuksessa käytettävissä olevalla datalla.
Tässä tutkimuksessa tarkastellaan pistejoukkojen pariutusongelmaa. Käytetyt pistejoukot ovat tutkimuksen piirissä tuotettu synteettisesti tai ovat peräisin metsäalueelta saadusta mittausaineistosta. Ratkaistujen pariutusten avulla voidaan löytää ongelmaan vaikuttavia muuttujia tai luoda laajempia pistejoukkoja yhdistämällä osittain päällekkäisiä joukkoja toisiinsa. Tutkimuksen aikana tarkasteltiin koordinaatiston valinnan vaikutusta, kun parien oletetaan olevan lähin kohdejoukon piste, sekä tapoja suodattaa tulosjoukosta selkeästi vääriä tuloksia. Tarkasteltiin myös pariutusongelman kuvantamiseen soveltuvia menetelmiä ja niiden mahdollisuuksia pariutusongelmien vaikeuden ja tuloksen oikeellisuuden arviointiin.
Tutkimuksen tuloksena havaittiin helpohkojen pariutusongelmien olevan tunnistettavissa, jonka jälkeen ongelman ratkaisuun voidaan hyödyntää laskennallisesti kevyitä menetelmiä hyvän lopputuloksen aikaansaamiseksi. Näissä tapauksissa pariutuksen tarkkuus on käytännössä riittävä, ja laskenta erittäin nopea tutkimuksessa käsitellyin menetelmin. Esitetyt menetelmät eivät ratkaise vaikeampia ongelmia, mutta toisaalta nämä voidaan tunnistaa, ja vaikeiden ongelmien tapauksessa on mahdollista joko rajoittaa pisteiden tiheyttä valitsemalla vain varmimpia ja selkeimpiä kiintopisteitä, tai käyttämällä parhaillaan kehittyviä joustavan sovittamisen menetelmiä, jotka ovat hivenen kalliimpia laskennallisesti.
Omana kappaleenaan esitetään tekoälymenetelmien soveltamista pistepilvien pariuttamisessa. Tekoälyn soveltamista varten muodostetaan käytettävissä oleva data koneoppimistarkoituksiin soveltuvaan muotoon, joka mahdollistaa menetelmien hyödyntämisen pariutustehtävässä. Lisäksi testataan ongelmaan sopivien koneoppimismallien suorituskykyä tutkimuksessa käytettävissä olevalla datalla.