Machine Learning Model for Predicting Malnutrition During Particle Radiotherapy in Cancer Patients
Xing, Xihan (2023-08-03)
Machine Learning Model for Predicting Malnutrition During Particle Radiotherapy in Cancer Patients
Xing, Xihan
(03.08.2023)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
suljettu
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2023080994546
https://urn.fi/URN:NBN:fi-fe2023080994546
Tiivistelmä
Malnutrition is a common complication for cancer patients, the change in body size due to malnutrition can lead to a mismatch with the customized molds during particle radiotherapy, which affects the accuracy and therapeutic effect of radiotherapy. During particle radiotherapy, early identification of risk factors for malnutrition and timely targeted nutritional interventions for cancer patients are of great clinical significance. However, the influencing factors of particle radiotherapy for cancer patients' malnutrition are still unclear. In screening people at high risk of disease, a standard method is to construct a prediction model. Machine learning is strongly advocated and promoted as a method for designing clinical prediction models due to its high predictive performance. Although there is a clinical criterion for malnutrition diagnosis (GLIM criteria), the GLIM criteria for measuring fat free mass (FFM), a body component, is not yet routinely used in clinical practice, and its operation is more complex and costly. Therefore, the purpose of the research was to first describe the occurrence of malnutrition in cancer patients during particle radiotherapy, and analyze its risk factors. Then construct, validate, compare, and visualize malnutrition prediction models for these patients using machine learning algorithms to improve the operability, accuracy, and ease of use of nutritional assessment.
In this study, a prospective cohort study design was used, and in the first part, 316 patients from October 2022 to January 2023 at Shanghai Proton and Heavy Ion Hospital were selected using a convenience sampling method. The current status of malnutrition was described, and the influencing factors were explored using univariate analysis and multivariate logistic regression analysis. In the second part of the prediction model construction, validation, comparison, and visualization, data from 316 patients in the previous phase were selected as the model construction cohort and 115 patients at the same hospital from February 2023 to March 2023 were selected as the model external validation cohort. Predictor variables with statistically significant (P<0.05) multivariate logistic regression analysis in the first stage were included, and the DT, RF, SVM, XGBoost, and LR of machine learning algorithms were used to construct and validate the particle malnutrition prediction model and visualize the model with a dynamic nomogram.
In the first part, the prevalence of malnutrition was 24.7% (78/316). Gender (OR=3.063, P=0.033), RT dose (OR=3.699, P=0.034), synchronous intravenous chemotherapy or targeted therapy (OR=5.937, P<0.001), BMI (OR=0.836, P=0.027), and NIS (OR=9.790, P<0.001) were independent influencing factors. In the second part, the five constructed models all have high prediction efficiency, among which the RF model and LR model have the highest AUC value (0.91), and the RF model has the highest accuracy (85.2%), precision (69.6%), and specificity (92.1%). The constructed model can maintain a high AUC value while being concise, the included variables can be obtained simply and economically in clinical practice, which can effectively improve the operability, accuracy, and ease of use of nutritional assessment for cancer patients with particle radiotherapy. It has an excellent clinical application scenario. Clinical medical staff can use the model to evaluate the nutritional status of cancer patients during particle radiotherapy, which has important clinical significance for early screening of high-risk malnourished patients undergoing particle radiotherapy. However, the research was only carried out in one hospital, the source of patients is single, and the representativeness of samples has certain limitations. Multi-center research can be carried out in the future. Vajaaravitsemus on yleinen komplikaatio syöpäpotilaille. Vajaaravitsemuksesta johtuva kehon koon muutos voi johtaa epäsuhtaan räätälöityjen muottien kanssa hiukkassädehoidon aikana, mikä vaikuttaa sädehoidon tarkkuuteen ja terapeuttiseen vaikutukseen. Vajaaravitsemuksen riskitekijöiden varhainen tunnistaminen ja syöpäpotilaiden oikea-aikaiset kohdennetut ravitsemukselliset interventiot ovat kliinisesti erittäin tärkeitä. Hiukkassädehoidon vaikutus syöpäpotilaiden aliravitsemukseen on kuitenkin edelleen epäselvä. Ennustusmallilla voisi olla mahdollista seuloa vajaaravitsemukselle alttiit potilaat. Koneoppimismenetelmät ovat suositeltuja niiden korkean ennustuskyvyn vuoksi. Vaikka vajaaravitsemuksen diagnosoimiseksi on olemassa kliininen kriteeri (GLIM-kriteerit), rasvattoman massan mittaamiseen tarkoitettua kriteeriä ei vielä käytetä rutiininomaisesti kliinisessä käytännössä. Sen käyttö on myös monimutkaisempaa ja kalliimpaa. Siksi tämän tutkimuksen tarkoituksena oli ensin kuvata vajaaravitsemuksen esiintymistä syöpäpotilailla hiukkassädehoidon aikana ja analysoida sen riskitekijöitä. Toiseksi tarkoituksena oli rakentaa, validoida, vertailla ja visualisoida näiden potilaiden vajaaravitsemuksen ennustemalleja koneoppimisalgoritmeja käyttäen ravitsemustilan arvioinnin käytettävyyden, tarkkuuden ja helppokäyttöisyyden parantamiseksi.
Tässä tutkimuksessa käytettiin prospektiivista kohorttitutkimusasetelmaa, ja ensimmäisessä osassa valittiin 316 potilasta Shanghain protoniraskasionisairaalassa lokakuun 2022 ja tammikuun 2023 välisenä aikana käyttäen mukavuusotantaa. Vajaaravitsemuksen nykytila kuvattiin, ja siihen yhteydessä olevia tekijöitä tutkittiin käyttämällä univariaattista analyysiä ja monimuuttujaista logistista regressioanalyysiä. Ennustemallin rakentamisen, validoinnin, vertailun ja visualisoinnin toisessa osassa mallin rakentamiskohortiksi valittiin edellisen vaiheen 316 potilaan tiedot ja mallin ulkoiseksi validointikohortiksi 115 potilasta samassa sairaalassa helmikuusta 2023 maaliskuuhun 2023. Ennustemuuttujat, jotka olivat tilastollisesti merkitseviä (P<0,05) ensimmäisessä vaiheessa, otettiin mukaan, ja koneoppimisalgoritmien DT-, RF-, SVM-, XGBoost- ja LR-algoritmeja käytettiin hiukkasmaisen vajaaravitsemuksen ennustemallin rakentamiseen ja validointiin sekä mallin visualisointiin dynaamisella nomogrammilla.
Ensimmäisessä osassa vajaaravitsemuksen esiintyvyys oli 24,7 % (78/316). Sukupuoli (OR=3,063, P=0,033), RT-annos (OR=3,699, P=0,034), synkroninen laskimonsisäinen kemoterapia tai kohdennettu hoito (OR=5,937, P<0,001), BMI (OR=0,836, P=0,027) ja NIS (OR=9,790, P<0,001) olivat vajaaravitsemukseen yhteydessä olevia tekijöitä. Toisessa osassa viidellä rakennetulla mallilla on kaikilla korkea ennustustehokkuus, joista RF-mallilla ja LR-mallilla on korkein AUC-arvo (0,91), ja RF-mallilla on korkein tarkkuus (85,2 %), tarkkuus (69,6 %) ja spesifisyys (92,1 %). Rakennettu malli voi säilyttää korkean AUC-arvon ja olla samalla tiivis. Malliin sisältyvät muuttujat voidaan saada yksinkertaisesti ja taloudellisesti kliinisessä käytännössä, mikä voi parantaa tehokkaasti hiukkassädehoitoa saavien syöpäpotilaiden ravitsemustilan arvioinnin toimivuutta, tarkkuutta ja helppokäyttöisyyttä. Mallilla on erinomainen kliininen sovellusskenaario. Kliininen hoitohenkilökunta voi käyttää mallia syöpäpotilaiden ravitsemustilan arviointiin hiukkassädehoidon aikana, millä on tärkeä kliininen merkitys hiukkassädehoitoa saavien korkean riskin vajaaravitsemuspotilaiden varhaisessa seulonnassa. Tutkimus toteutettiin kuitenkin vain yhdessä sairaalassa, ja näytteiden edustavuuteen liittyy tiettyjä rajoituksia. Tulevaisuudessa olisi hyvä toteuttaa monikeskustutkimuksia.
In this study, a prospective cohort study design was used, and in the first part, 316 patients from October 2022 to January 2023 at Shanghai Proton and Heavy Ion Hospital were selected using a convenience sampling method. The current status of malnutrition was described, and the influencing factors were explored using univariate analysis and multivariate logistic regression analysis. In the second part of the prediction model construction, validation, comparison, and visualization, data from 316 patients in the previous phase were selected as the model construction cohort and 115 patients at the same hospital from February 2023 to March 2023 were selected as the model external validation cohort. Predictor variables with statistically significant (P<0.05) multivariate logistic regression analysis in the first stage were included, and the DT, RF, SVM, XGBoost, and LR of machine learning algorithms were used to construct and validate the particle malnutrition prediction model and visualize the model with a dynamic nomogram.
In the first part, the prevalence of malnutrition was 24.7% (78/316). Gender (OR=3.063, P=0.033), RT dose (OR=3.699, P=0.034), synchronous intravenous chemotherapy or targeted therapy (OR=5.937, P<0.001), BMI (OR=0.836, P=0.027), and NIS (OR=9.790, P<0.001) were independent influencing factors. In the second part, the five constructed models all have high prediction efficiency, among which the RF model and LR model have the highest AUC value (0.91), and the RF model has the highest accuracy (85.2%), precision (69.6%), and specificity (92.1%). The constructed model can maintain a high AUC value while being concise, the included variables can be obtained simply and economically in clinical practice, which can effectively improve the operability, accuracy, and ease of use of nutritional assessment for cancer patients with particle radiotherapy. It has an excellent clinical application scenario. Clinical medical staff can use the model to evaluate the nutritional status of cancer patients during particle radiotherapy, which has important clinical significance for early screening of high-risk malnourished patients undergoing particle radiotherapy. However, the research was only carried out in one hospital, the source of patients is single, and the representativeness of samples has certain limitations. Multi-center research can be carried out in the future.
Tässä tutkimuksessa käytettiin prospektiivista kohorttitutkimusasetelmaa, ja ensimmäisessä osassa valittiin 316 potilasta Shanghain protoniraskasionisairaalassa lokakuun 2022 ja tammikuun 2023 välisenä aikana käyttäen mukavuusotantaa. Vajaaravitsemuksen nykytila kuvattiin, ja siihen yhteydessä olevia tekijöitä tutkittiin käyttämällä univariaattista analyysiä ja monimuuttujaista logistista regressioanalyysiä. Ennustemallin rakentamisen, validoinnin, vertailun ja visualisoinnin toisessa osassa mallin rakentamiskohortiksi valittiin edellisen vaiheen 316 potilaan tiedot ja mallin ulkoiseksi validointikohortiksi 115 potilasta samassa sairaalassa helmikuusta 2023 maaliskuuhun 2023. Ennustemuuttujat, jotka olivat tilastollisesti merkitseviä (P<0,05) ensimmäisessä vaiheessa, otettiin mukaan, ja koneoppimisalgoritmien DT-, RF-, SVM-, XGBoost- ja LR-algoritmeja käytettiin hiukkasmaisen vajaaravitsemuksen ennustemallin rakentamiseen ja validointiin sekä mallin visualisointiin dynaamisella nomogrammilla.
Ensimmäisessä osassa vajaaravitsemuksen esiintyvyys oli 24,7 % (78/316). Sukupuoli (OR=3,063, P=0,033), RT-annos (OR=3,699, P=0,034), synkroninen laskimonsisäinen kemoterapia tai kohdennettu hoito (OR=5,937, P<0,001), BMI (OR=0,836, P=0,027) ja NIS (OR=9,790, P<0,001) olivat vajaaravitsemukseen yhteydessä olevia tekijöitä. Toisessa osassa viidellä rakennetulla mallilla on kaikilla korkea ennustustehokkuus, joista RF-mallilla ja LR-mallilla on korkein AUC-arvo (0,91), ja RF-mallilla on korkein tarkkuus (85,2 %), tarkkuus (69,6 %) ja spesifisyys (92,1 %). Rakennettu malli voi säilyttää korkean AUC-arvon ja olla samalla tiivis. Malliin sisältyvät muuttujat voidaan saada yksinkertaisesti ja taloudellisesti kliinisessä käytännössä, mikä voi parantaa tehokkaasti hiukkassädehoitoa saavien syöpäpotilaiden ravitsemustilan arvioinnin toimivuutta, tarkkuutta ja helppokäyttöisyyttä. Mallilla on erinomainen kliininen sovellusskenaario. Kliininen hoitohenkilökunta voi käyttää mallia syöpäpotilaiden ravitsemustilan arviointiin hiukkassädehoidon aikana, millä on tärkeä kliininen merkitys hiukkassädehoitoa saavien korkean riskin vajaaravitsemuspotilaiden varhaisessa seulonnassa. Tutkimus toteutettiin kuitenkin vain yhdessä sairaalassa, ja näytteiden edustavuuteen liittyy tiettyjä rajoituksia. Tulevaisuudessa olisi hyvä toteuttaa monikeskustutkimuksia.