Predicting takeover targets utilising ensemble machine learning techniques : Empirical evidence from the United States
Rahikainen, Alpertti (2024-09-08)
Predicting takeover targets utilising ensemble machine learning techniques : Empirical evidence from the United States
Rahikainen, Alpertti
(08.09.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
suljettu
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024091170405
https://urn.fi/URN:NBN:fi-fe2024091170405
Tiivistelmä
Takeover prediction has received notable attention from both scholars and industry professionals due to its profound societal and economic implications. Despite its importance, academic research in the area remains limited, with mixed results regarding the predictability of takeover targets. Furthermore, much of the existing literature has predominantly relied on traditional prediction methods, particularly logistic regression.
This study aims to enhance takeover prediction models by applying advanced machine learning techniques, specifically focusing on ensemble methods including Random Forest, AdaBoost, and Gradient Boosting. Ensemble prediction technique being completely novel in the field of takeover prediction. The primary goal is to develop a robust predictive model that can accurately identify potential takeover targets, while addressing the shortcomings of traditional methods like logistic regression. The models are trained and tested using financial statement data from the United States spanning 2011-2021. A comprehensive literature review is carried out to identify the most important elements of takeover prediction, which are utilised in the empirical study’s design.
The results demonstrate that machine learning models offer superior performance compared to the logistic regression model used as a benchmark. The Random Forest model provides a well-balanced overall performance, while Gradient Boosting emerges as the most discriminative, despite a higher false positive rate. AdaBoost achieves the highest accuracy, primarily due to its effectiveness in classifying the majority class of non-targets, though this limits its practical utility.
This research contributes to the emerging body of literature on financial prediction by showcasing the advantages of machine learning-based ensemble methods in the context of takeover prediction. The study emphasises the importance of selecting the appropriate prediction model based on specific application requirements, as no single model performs optimally across all metrics. The findings suggest that Random Forest and Gradient Boosting offer substantial potential for practical applications, delivering more reliable predictions than traditional logistic regression models.
This study not only validates the effectiveness of these machine learning methods but also provides insights into the practical challenges and considerations involved in their implementation. The insights derived from this study highlight the capability of ensemble based machine learning techniques to enhance predictive analytics in the complex domain of takeover prediction and offer a valuable guide for future practitioners and researchers. Additionally, the study identifies several avenues for further research, grounded in both empirical findings and existing literature. Yritysostojen ennustaminen on herättänyt suurta kiinnostusta tutkijoiden sekä muiden toimijoiden keskuudessa, koska sillä on suuria yhteiskunnallisia ja taloudellisia vaikutuksia. Suuresta merkityksestä huolimatta alan akateeminen tutkimus on edelleen vähäistä, ja tulokset yritysostokohteiden ennustettavuudesta ovat vaihtelevia. Lisäksi suuri osa olemassa olevasta kirjallisuudesta perustuu perinteisiin ennustusmenetelmiin, erityisesti logistiseen regressioon.
Tässä opinnäytetyössä pyritään parantamaan yritysostojen ennustemalleja soveltamalla kehittyneitä koneoppimistekniikoita ja keskittymällä erityisesti ensemble-ennustustekniikkaan perustuviin menetelmiin, kuten Random Forest, AdaBoost ja Gradient Boosting. Ensemble-tekniikka on uusi ennustustekniikka yritysostojen ennustamisen alalla. Ensisijaisena tavoitteena on kehittää luotettava ennustemalli, jolla voidaan tunnistaa tehokkaasti mahdolliset yritysostokohteet ja samalla täydentää perinteisten menetelmien, kuten logistisen regression puutteita. Ennustemallit koulutetaan ja testataan käyttäen yrityksien tilinpäätöstietoja Yhdysvalloista vuosilta 2011-2021. Yritysostojen ennustamiseen vaikuttavien keskeisten tekijöiden tunnistamiseksi tehdään kattava kirjallisuuskatsaus, jota hyödynnetään empiirisen tutkimuksen suunnittelussa.
Opinnäytetyön tulokset osoittavat, että testatut koneoppimismallit pystyvät suorituskyvyltään parempiin tuloksiin, kuin vertailukohtana käytetty logistinen regressiomalli. Random Forest -malli tarjoaa kokonaisvaltaisesti tasapainoista suorituskykyä, kun taas Gradient Boosting -malli osoittautuu parhaimmaksi kohteiden luokittelussa, vaikka väärien positiivisten ennustusten määrä on suurempi. AdaBoost saavuttaa malleista parhaan tarkkuuden, mikä johtuu pääasiassa siitä, että se luokittelee tehokkaasti enemmistöluokan, joka koostuu yrityksistä, jotka eivät päädy yritysoston kohteeksi. Tämä kuitenkin rajoittaa mallin käyttökelpoisuutta käytännössä.
Tämä opinnäytetyö täydentää taloudellista ennustamista käsittelevää kirjallisuutta esittelemällä koneoppimiseen perustuvien ensemble-tekniikoiden etuja yritysostojen ennustamisessa. Opinnäytetyö korostaa, että on tärkeää valita sopiva ennustusmalli tapauskohtaisten vaatimusten perusteella, sillä mikään yksittäisistä malleista ei ole ylivertainen kaikilla mittareilla mitattuna. Tulokset osoittavat, että sekä Random Forest että Gradient Boosting -tekniikat tarjoavat huomattavaa potentiaalia käytännön sovelluksiin, sillä ne pystyvät tuottamaan luotettavampia ennusteita kuin perinteiset logistiseen regressioon perustuvat ennustusmallit.
Tämä opinnäytetyö todistaa näiden koneoppimismenetelmien tehokkuuden ja antaa myös tietoa niiden toteuttamiseen liittyvistä käytännön haasteista ja näkökohdista. Tutkimuksen havainnot korostavat ensemble-koneoppimisen mahdollisuuksia parantaa ennustusmenetelmiä yritysostojen moninaisella kentällä, ja ne toimivat hyödyllisenä ohjeena tuleville tutkijoille ja muille toimijoille. Lisäksi tutkimuksessa esitetään jatkotutkimusaiheita, jotka perustuvat sekä empiirisiin tuloksiin että olemassa olevaan kirjallisuuteen.
This study aims to enhance takeover prediction models by applying advanced machine learning techniques, specifically focusing on ensemble methods including Random Forest, AdaBoost, and Gradient Boosting. Ensemble prediction technique being completely novel in the field of takeover prediction. The primary goal is to develop a robust predictive model that can accurately identify potential takeover targets, while addressing the shortcomings of traditional methods like logistic regression. The models are trained and tested using financial statement data from the United States spanning 2011-2021. A comprehensive literature review is carried out to identify the most important elements of takeover prediction, which are utilised in the empirical study’s design.
The results demonstrate that machine learning models offer superior performance compared to the logistic regression model used as a benchmark. The Random Forest model provides a well-balanced overall performance, while Gradient Boosting emerges as the most discriminative, despite a higher false positive rate. AdaBoost achieves the highest accuracy, primarily due to its effectiveness in classifying the majority class of non-targets, though this limits its practical utility.
This research contributes to the emerging body of literature on financial prediction by showcasing the advantages of machine learning-based ensemble methods in the context of takeover prediction. The study emphasises the importance of selecting the appropriate prediction model based on specific application requirements, as no single model performs optimally across all metrics. The findings suggest that Random Forest and Gradient Boosting offer substantial potential for practical applications, delivering more reliable predictions than traditional logistic regression models.
This study not only validates the effectiveness of these machine learning methods but also provides insights into the practical challenges and considerations involved in their implementation. The insights derived from this study highlight the capability of ensemble based machine learning techniques to enhance predictive analytics in the complex domain of takeover prediction and offer a valuable guide for future practitioners and researchers. Additionally, the study identifies several avenues for further research, grounded in both empirical findings and existing literature.
Tässä opinnäytetyössä pyritään parantamaan yritysostojen ennustemalleja soveltamalla kehittyneitä koneoppimistekniikoita ja keskittymällä erityisesti ensemble-ennustustekniikkaan perustuviin menetelmiin, kuten Random Forest, AdaBoost ja Gradient Boosting. Ensemble-tekniikka on uusi ennustustekniikka yritysostojen ennustamisen alalla. Ensisijaisena tavoitteena on kehittää luotettava ennustemalli, jolla voidaan tunnistaa tehokkaasti mahdolliset yritysostokohteet ja samalla täydentää perinteisten menetelmien, kuten logistisen regression puutteita. Ennustemallit koulutetaan ja testataan käyttäen yrityksien tilinpäätöstietoja Yhdysvalloista vuosilta 2011-2021. Yritysostojen ennustamiseen vaikuttavien keskeisten tekijöiden tunnistamiseksi tehdään kattava kirjallisuuskatsaus, jota hyödynnetään empiirisen tutkimuksen suunnittelussa.
Opinnäytetyön tulokset osoittavat, että testatut koneoppimismallit pystyvät suorituskyvyltään parempiin tuloksiin, kuin vertailukohtana käytetty logistinen regressiomalli. Random Forest -malli tarjoaa kokonaisvaltaisesti tasapainoista suorituskykyä, kun taas Gradient Boosting -malli osoittautuu parhaimmaksi kohteiden luokittelussa, vaikka väärien positiivisten ennustusten määrä on suurempi. AdaBoost saavuttaa malleista parhaan tarkkuuden, mikä johtuu pääasiassa siitä, että se luokittelee tehokkaasti enemmistöluokan, joka koostuu yrityksistä, jotka eivät päädy yritysoston kohteeksi. Tämä kuitenkin rajoittaa mallin käyttökelpoisuutta käytännössä.
Tämä opinnäytetyö täydentää taloudellista ennustamista käsittelevää kirjallisuutta esittelemällä koneoppimiseen perustuvien ensemble-tekniikoiden etuja yritysostojen ennustamisessa. Opinnäytetyö korostaa, että on tärkeää valita sopiva ennustusmalli tapauskohtaisten vaatimusten perusteella, sillä mikään yksittäisistä malleista ei ole ylivertainen kaikilla mittareilla mitattuna. Tulokset osoittavat, että sekä Random Forest että Gradient Boosting -tekniikat tarjoavat huomattavaa potentiaalia käytännön sovelluksiin, sillä ne pystyvät tuottamaan luotettavampia ennusteita kuin perinteiset logistiseen regressioon perustuvat ennustusmallit.
Tämä opinnäytetyö todistaa näiden koneoppimismenetelmien tehokkuuden ja antaa myös tietoa niiden toteuttamiseen liittyvistä käytännön haasteista ja näkökohdista. Tutkimuksen havainnot korostavat ensemble-koneoppimisen mahdollisuuksia parantaa ennustusmenetelmiä yritysostojen moninaisella kentällä, ja ne toimivat hyödyllisenä ohjeena tuleville tutkijoille ja muille toimijoille. Lisäksi tutkimuksessa esitetään jatkotutkimusaiheita, jotka perustuvat sekä empiirisiin tuloksiin että olemassa olevaan kirjallisuuteen.