dc.contributor.author | Heino, Juhana | |
dc.date.accessioned | 2022-09-16T21:01:25Z | |
dc.date.available | 2022-09-16T21:01:25Z | |
dc.date.issued | 2022-09-14 | |
dc.identifier.uri | https://www.utupub.fi/handle/10024/154700 | |
dc.description.abstract | Työn tarkoituksena on tutustua ohjaamattomiin anomaliantunnistusmenetelmiin ensin kirjallisuudesta ja sitten käyttäen kerättyä soveltuvaa aineistoa. Aineisto kerätään Helsingin Seudun Liikenteen (HSL) MQTT-rajapinnasta ja aineisto koostuu linja-autolinjan numero 20 reitistä ja noin 2000 vuorosta.
Koska kerätty aineisto on raakadataa suoraan HSL:n API:sta, työhön oleellisena osana kuuluu myös aineiston käsittely sopivaan muotoon. Aineisto tiivistetään, esisuodatetaan ja kootaan soveltuvaksi rakenteeksi.
Menetelmät, joita sovelletaan ovat Z-score, Mahalanobiksen etäisyys, K-means, lähinaapurimenetelmä, hierarkkinen klusterointi, DBSCAN ja LOF. Kaikista käydään teoriaa soveltuvissa määrin läpi, jonka jälkeen jokaista käytetään työn aineistoon käytännössä. Näistä syntyy mallijoukko (ensemble), joka löytää aineistosta anomaliavuoroja. | |
dc.format.extent | 56 | |
dc.language.iso | fin | |
dc.rights | fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | |
dc.subject | ohjaamattomat menetelmät, anomalioiden tunnistus, joukkoliikenne, mallijoukot | |
dc.title | Ohjaamaton anomalioiden tunnistus linja-autovuorojen ajotiedoista | |
dc.type.ontasot | fi=Pro gradu -tutkielma|en=Master's thesis| | |
dc.rights.accessrights | avoin | |
dc.identifier.urn | URN:NBN:fi-fe2022091659367 | |
dc.contributor.faculty | fi=Matemaattis-luonnontieteellinen tiedekunta|en=Faculty of Science| | |
dc.contributor.studysubject | fi=Tilastotiede|en=Statistics| | |
dc.contributor.department | fi=Matematiikan ja tilastotieteen laitos|en=Department of Mathematics and Statistics| | |