Koneoppimisen hyödyntäminen baseball-pelaajien loukkaantumisien havaitsemisessa
Kiviniemi, Topi (2024-03-11)
Koneoppimisen hyödyntäminen baseball-pelaajien loukkaantumisien havaitsemisessa
Kiviniemi, Topi
(11.03.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
suljettu
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024031911962
https://urn.fi/URN:NBN:fi-fe2024031911962
Tiivistelmä
Baseball on etenkin Yhdysvalloissa merkittävä urheilulaji, johon liittyy, kuten muihinkin urheilulajeihin, erilaisia loukkaantumisia. Loukkaantumiset aiheuttavat taloudellisia ongelmia paitsi itse joukkueille myös muille sidosryhmille, joten on syntynyt tarve pyrkiä ennustamaan ja ehkäisemään niitä. Tutkielman keskeisenä päämääränä on tutkia nykyaikaisten koneoppimismenetelmien tehokkuutta loukkaantumisien ennustamisessa verrattuna perinteisempiin tilastollisiin menetelmiin.
Baseballin lajin luonteesta johtuen syöttäjät ovat erityisesti jatkuvan rasituksen alaisena joutuessaan heittämään useita satoja heittoja yhdessä pelissä, joten tutkimuksissakin kategorisointi tapahtuu syöttäjiin ja muihin pelaajiin. Pitkien kausien aikana syöttäjä voi altistua useille loukkaantumisille, jotka usein aiheutuvat ylävartalon alueelle. Erityisen kovan rasituksen alaisena ovat syöttökäden kyynärpää ja olkapää. Niveliin kohdistuu merkittäviä vääntövoimia, mikä lisää niin lyhytaikaisten kuin pitkäaikaistenkin vammojen riskiä.
Tutkielmassa käsitellään koneoppimismenetelmistä loukkaantumisien kannalta tärkeimpiä menetelmiä eli ohjattuja koneoppimismenetelmiä. Ohjatuissa koneoppimismenetelmissä hyödynnetään luokittimia, jotka niille ominaisten sääntöjen mukaan luokittelevat aineiston. Luokittimet eroavat luokittelutapojensa mukaan ja niillä on olennainen vaikutus ennustuksien luotettavuuteen, sillä erilaisille aineistoille toiset luokittimet voivat toimia tehokkaammin kuin toisille. Yhtenä merkittävänä luokittimena voidaan pitää gradienttivahvistukseen perustuvaa luokitinta. Se on nykyisten tutkimusten varjolla laadukkain ja tarkin ennustamaan loukkaantumisia päätöspuihin sekä useisiin iteraatioihin perustuvalla luokittelulla. Gradienttivahvistus ja muutama muu luokitin kykenevät ennustamaan loukkaantumisia tarkemmin kuin esimerkiksi perinteinen logistinen regressio. Koneoppimismenetelmät ovat epäilemättä loukkaantumisien ehkäisemisessä, kliinisessä työssä ja ennustamisessa tulevaisuuden apuväline. Ne pystyvät parhaimmillaan ennustamaan tiettyjen ruumiinosien loukkaantumisia yli 90% tarkkuudella. Tämä on tärkeää informaatiota baseballin sidosryhmille, sillä esimerkiksi joukkueet pystyvät hyödyntämään saatuja ennusteita harjoitteluohjelmissaan fyysisen rasituksen osalta. Täysin ylivoimaisia koneoppimismenetelmät eivät ennustamisessa kuitenkaan ole, vaan kehityskohteita löytyy mallien yleistettävyyden, datan hyödyntämisen sekä data koon osalta.
Baseballin lajin luonteesta johtuen syöttäjät ovat erityisesti jatkuvan rasituksen alaisena joutuessaan heittämään useita satoja heittoja yhdessä pelissä, joten tutkimuksissakin kategorisointi tapahtuu syöttäjiin ja muihin pelaajiin. Pitkien kausien aikana syöttäjä voi altistua useille loukkaantumisille, jotka usein aiheutuvat ylävartalon alueelle. Erityisen kovan rasituksen alaisena ovat syöttökäden kyynärpää ja olkapää. Niveliin kohdistuu merkittäviä vääntövoimia, mikä lisää niin lyhytaikaisten kuin pitkäaikaistenkin vammojen riskiä.
Tutkielmassa käsitellään koneoppimismenetelmistä loukkaantumisien kannalta tärkeimpiä menetelmiä eli ohjattuja koneoppimismenetelmiä. Ohjatuissa koneoppimismenetelmissä hyödynnetään luokittimia, jotka niille ominaisten sääntöjen mukaan luokittelevat aineiston. Luokittimet eroavat luokittelutapojensa mukaan ja niillä on olennainen vaikutus ennustuksien luotettavuuteen, sillä erilaisille aineistoille toiset luokittimet voivat toimia tehokkaammin kuin toisille. Yhtenä merkittävänä luokittimena voidaan pitää gradienttivahvistukseen perustuvaa luokitinta. Se on nykyisten tutkimusten varjolla laadukkain ja tarkin ennustamaan loukkaantumisia päätöspuihin sekä useisiin iteraatioihin perustuvalla luokittelulla. Gradienttivahvistus ja muutama muu luokitin kykenevät ennustamaan loukkaantumisia tarkemmin kuin esimerkiksi perinteinen logistinen regressio. Koneoppimismenetelmät ovat epäilemättä loukkaantumisien ehkäisemisessä, kliinisessä työssä ja ennustamisessa tulevaisuuden apuväline. Ne pystyvät parhaimmillaan ennustamaan tiettyjen ruumiinosien loukkaantumisia yli 90% tarkkuudella. Tämä on tärkeää informaatiota baseballin sidosryhmille, sillä esimerkiksi joukkueet pystyvät hyödyntämään saatuja ennusteita harjoitteluohjelmissaan fyysisen rasituksen osalta. Täysin ylivoimaisia koneoppimismenetelmät eivät ennustamisessa kuitenkaan ole, vaan kehityskohteita löytyy mallien yleistettävyyden, datan hyödyntämisen sekä data koon osalta.