Yleistetyn lineaarisen mallin selittävien muuttujien automaattinen haku geneettisten algoritmien avulla
Imeri, Menduh (2017-08-01)
Yleistetyn lineaarisen mallin selittävien muuttujien automaattinen haku geneettisten algoritmien avulla
Imeri, Menduh
(01.08.2017)
Tätä artikkelia/julkaisua ei ole tallennettu UTUPubiin. Julkaisun tiedoissa voi kuitenkin olla linkki toisaalle tallennettuun artikkeliin / julkaisuun.
Turun yliopisto
Kuvaus
Siirretty Doriasta
Tiivistelmä
Tässä tutkielmassa perehdytään yleistettyjen lineaaristen mallien (GLM) sekä geneettisten algoritmien teoriaan ja tarkastellaan, kuinka geneettiset algoritmit soveltuvat yleistettyjen lineaaristen mallien selittävien muuttujien hakumenetelmänä. Yleistetyt lineaariset mallit ovat tilastollisessa mallinnuksessa tehokkaita työkaluja. Niiden avulla pyritään selittämään tiettyä ilmiötä, jota kutsutaan yleensä vasteeksi tai lineaariseksi prediktoriksi käyttäen sopivaa linkkifunktiota, joka oletetaan monotoniseksi sekä dierentioituvaksi. Vasteen selittämiseen käytetään selittäviä muuttujia eli kovariaatteja. Mallin valinnassa tarkoituksena on minimoida virhettä eli devianssia.
Tutkielman toinen olennainen osa ovat evoluutioteoriaan perustuvat geneettiset algoritmit (GA). Optimoinnissa tämä heijastuu siihen, että kelvolliset ratkaisut säilyvät algoritmissa ja muut eivät. Geneettiset algoritmit ovat yhdistelmä biologiaa sekä tietojenkäsittelytiedettä. Algoritmi suorittaa iteratiivisen prosessin, joka soveltaa niin kutsuttuja geneettisiä operaattoita, joista yleisimmät ovat mutaatio, risteytys sekä siirtolaisuus. Ehdokasratkaisuja kutustaan kromosomeiksi, jotka koostuvat geeneistä. Tietokone tulkitsee kromosomit binäärilukuina, joten geenit saavat joko arvon 0 tai 1. Operaattorit manipuloivat kromosomeja geenitasolla ja luo uusia ratkaisuja perustuen kromosomien geneettiseen informaatioon.
Tutkielman lopussa yhdistetään edellä mainittu teoria, sovelletaan niitä liikennevakuutusaineistoon. Tavoitteena on luoda yleistetty lineaarinen malli, jossa pyritään selittämään sattuneiden vahinkojen kokonaismäärää käyttäen ajoneuvovakuuttamisessa sopivia muuttujia, kuten vakuutetun ikää, ajoneuvon merkkiä tai moottorin tilavuutta. GLM on liikennevakuutuksen hinnoittelun kannalta erittäin olennainen, sillä kokemusperäiseen eli historialliseen aineistoon perustuva hinnoittelu voidaan ennustaa käyttäen lineaarisia malleja. Ideana on soveltaa GLM- sekä GA –teoriaa mallin valinnan automatisoinnissa. Tutkielman perusteella voidaan todeta, että automatisointi on hyvä ratkaisu mallinnuksessa erityisesti, kun aineisto on suuri.
Tutkielman toinen olennainen osa ovat evoluutioteoriaan perustuvat geneettiset algoritmit (GA). Optimoinnissa tämä heijastuu siihen, että kelvolliset ratkaisut säilyvät algoritmissa ja muut eivät. Geneettiset algoritmit ovat yhdistelmä biologiaa sekä tietojenkäsittelytiedettä. Algoritmi suorittaa iteratiivisen prosessin, joka soveltaa niin kutsuttuja geneettisiä operaattoita, joista yleisimmät ovat mutaatio, risteytys sekä siirtolaisuus. Ehdokasratkaisuja kutustaan kromosomeiksi, jotka koostuvat geeneistä. Tietokone tulkitsee kromosomit binäärilukuina, joten geenit saavat joko arvon 0 tai 1. Operaattorit manipuloivat kromosomeja geenitasolla ja luo uusia ratkaisuja perustuen kromosomien geneettiseen informaatioon.
Tutkielman lopussa yhdistetään edellä mainittu teoria, sovelletaan niitä liikennevakuutusaineistoon. Tavoitteena on luoda yleistetty lineaarinen malli, jossa pyritään selittämään sattuneiden vahinkojen kokonaismäärää käyttäen ajoneuvovakuuttamisessa sopivia muuttujia, kuten vakuutetun ikää, ajoneuvon merkkiä tai moottorin tilavuutta. GLM on liikennevakuutuksen hinnoittelun kannalta erittäin olennainen, sillä kokemusperäiseen eli historialliseen aineistoon perustuva hinnoittelu voidaan ennustaa käyttäen lineaarisia malleja. Ideana on soveltaa GLM- sekä GA –teoriaa mallin valinnan automatisoinnissa. Tutkielman perusteella voidaan todeta, että automatisointi on hyvä ratkaisu mallinnuksessa erityisesti, kun aineisto on suuri.