Koneoppimismenetelmien hyödyntäminen IoT-datan poikkeavien arvojen havaitsemiseen
Virtanen, Akseli (2024-06-03)
Koneoppimismenetelmien hyödyntäminen IoT-datan poikkeavien arvojen havaitsemiseen
Virtanen, Akseli
(03.06.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024061150418
https://urn.fi/URN:NBN:fi-fe2024061150418
Tiivistelmä
IoT-laitteiden yleistymisen myötä myös niiden tuottama data on moninkertaistunut. Jotta dataa voidaan hyödyntää, tulee sen tulkitsemisen olla helppoa ja tehokasta. Yksi datan tulkintaan vaikuttavista ongelmista on siinä ilmenevät poikkeavat arvot. Poikkeava arvo on muista havainnoista selkeästi eroava havainto. Tämä ongelma ilmenee etenkin IoT-dataa analysoitaessa, sillä IoT-verkon eri sensorit ovat alttiitta monenlaisille häiriöille, jonka seurauksena syntyy poikkeavia arvoja. Datan määrän kasvun seurauksena perinteiset menetelmät eivät ole riittävän tehokas tapa havaita poikkeavia arvoja. Tästä syystä on kehitetty erilaisia koneoppimismenetelmiä poikkeavien arvojen nopeampaan ja tarkempaan havaitsemiseen.
Tutkielma toteutettiin kirjallisuuskatsauksena ja siinä käsitellään koneoppimismenetelmien hyödyntämistä poikkeavien arvojen havaitsemisessa. Tutkielmassa tarkastellaan eri käyttökohteita ja niissä käytettyjä menetelmiä. Lisäksi pyrittiin löytämään syitä käytettyjen menetelmien valintaan.
Eri koneoppimismenetelmillä on kaikilla heikkouksia ja vahvuuksia. Koneoppimismenetelmän valintaan vaikuttaa paljon sen käyttökohde. IoT-laitteet ovat yleistyneet etenkin terveyden ja lääketieteen, teollisuuden ja älykotien ja -kaupunkien yhteydessä. Analysoitavan datan tulee olla hyvänlaatuista, joten mahdolliset virheelliset arvot ja viat tulee tunnistaa aikaisin. Koneoppimismenetelmät parantavat suurten datamäärien analysoinnin tehokkuutta ja mahdollistavat monenlaisten eri datatyyppien poikkeavien arvojen löytämisen. Koneoppimismentelemien hyödyntämisen etuna on poikkeavien arvojen ja niihin johtaneiden tapahtumien yhteyden tunnistaminen, sekä mahdollinen käytöksen pitkäaikaisen muutoksen havaitseminen ja uusien kaavojen havaitseminen.
Koneoppimismenetelmistä yleisimpiä poikkeavien arvojen havaitsemiseen ovat tukivektorikone ja K:n keskiarvon ryvästys. Eri menetelmien tehokkuuksia vertaillessa tehtävästä riippuen oli paljon vaihtelua menetelmien toimivuudessa, mutta monia menetelmiä yhdistelevät hybridimallit toimivat parhaiten poikkeavuuksien havaitsemisessa. Menetelmien toimivuuteen vaikuttaa paljon käyttökohteen data.
Tutkielma toteutettiin kirjallisuuskatsauksena ja siinä käsitellään koneoppimismenetelmien hyödyntämistä poikkeavien arvojen havaitsemisessa. Tutkielmassa tarkastellaan eri käyttökohteita ja niissä käytettyjä menetelmiä. Lisäksi pyrittiin löytämään syitä käytettyjen menetelmien valintaan.
Eri koneoppimismenetelmillä on kaikilla heikkouksia ja vahvuuksia. Koneoppimismenetelmän valintaan vaikuttaa paljon sen käyttökohde. IoT-laitteet ovat yleistyneet etenkin terveyden ja lääketieteen, teollisuuden ja älykotien ja -kaupunkien yhteydessä. Analysoitavan datan tulee olla hyvänlaatuista, joten mahdolliset virheelliset arvot ja viat tulee tunnistaa aikaisin. Koneoppimismenetelmät parantavat suurten datamäärien analysoinnin tehokkuutta ja mahdollistavat monenlaisten eri datatyyppien poikkeavien arvojen löytämisen. Koneoppimismentelemien hyödyntämisen etuna on poikkeavien arvojen ja niihin johtaneiden tapahtumien yhteyden tunnistaminen, sekä mahdollinen käytöksen pitkäaikaisen muutoksen havaitseminen ja uusien kaavojen havaitseminen.
Koneoppimismenetelmistä yleisimpiä poikkeavien arvojen havaitsemiseen ovat tukivektorikone ja K:n keskiarvon ryvästys. Eri menetelmien tehokkuuksia vertaillessa tehtävästä riippuen oli paljon vaihtelua menetelmien toimivuudessa, mutta monia menetelmiä yhdistelevät hybridimallit toimivat parhaiten poikkeavuuksien havaitsemisessa. Menetelmien toimivuuteen vaikuttaa paljon käyttökohteen data.