Potilasasiakirjat tietolähteenä sydänpotilaan hoitoprosessin viiveiden arvioinnissa : Kohti viiveiden tunnistamista ja ennustamista käyttäen luonnollisen kielen käsittelyä
Myllymäki, Emmi (2024-07-05)
Potilasasiakirjat tietolähteenä sydänpotilaan hoitoprosessin viiveiden arvioinnissa : Kohti viiveiden tunnistamista ja ennustamista käyttäen luonnollisen kielen käsittelyä
Myllymäki, Emmi
(05.07.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
suljettu
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024072562617
https://urn.fi/URN:NBN:fi-fe2024072562617
Tiivistelmä
Viiveet hoitoprosessissa voivat aiheuttaa haittaa sekä potilaalle että henkilöstölle ja aiheuttaa
lisäkustannuksia terveydenhuollolle. Sydän- ja verisuonisairaudet ovat merkittävä kansantauti ja yksi
yleisimmistä syistä erikoissairaanhoidon vuodeosastohoidolle, joten on olennaista pyrkiä vaikuttamaan
sydänpotilaiden hoitoprosessin viiveisiin. Yksi nouseva teknologia terveydenhuollon kentällä on
luonnollisen kielen käsittely (NLP), joka voi olla hyödyksi viiveiden tunnistamisessa ja
ennustamisessa. Toimiakseen NLP käyttää erilaisia tietomallinnuksen keinoja, kuten sanastoja.
Manuaalisesti annotoidut sanastot lisäävät NLP-pohjaisen työkalun luotettavuutta tai on jopa edellytys
sen tarkemmalle toiminnalle.
Tutkimuksen tarkoituksena oli kuvata sydänpotilaiden potilasasiakirjoihin kirjattuja hoitoprosessin
viiveitä ja niihin liittyviä kirjattuja syitä. Tavoitteena oli muodostaa potilasasiakirjojen ilmauksista
sanasto, jota hyödyntämällä voidaan NLP:n avulla tulevaisuudessa tunnistaa tai ennustaa
potilasasiakirjoista automaattisesti ja reaaliaikaisesti hoitoprosessin viive ja sen mahdollisia syitä.
Tutkimusasetelmana oli retrospektiivinen potilasasiakirja-analyysi. Tutkimusaineistona oli yhden
yliopistosairaalan sähköiset potilasasiakirjat. Aineistosta tehtiin ensin klusteriotanta (n=479 228)
viivettä kuvaavien sanojen ja fraasien avulla. Tästä joukosta otettiin satunnaisotannalla 300 potilaan
otos. Potilasasiakirjat käsittivät lääkärien, sairaanhoitajien ja muiden hoitoon osallistuvien
ammattilaisten kirjaukset. Aineisto analysoitiin deduktiivisen sisällönanalyysin menetelmin, jota
varten muodostettiin analyysimatriisi kirjallisuuskatsauksen pohjalta. Tämän jälkeen aineisto
annotoitiin BRAT-annotointityökalun avulla. Aineisto saturoitui 200 potilaan kohdalla, jolloin
annotointi lopetettiin. Analyysiä jatkettiin vielä induktiivisella luokittelulla ja tilastollisilla
menetelmillä.
Analysoituja merkintöjä oli yhteensä 62 365. Aineistosta löytyi 391 ilmausta, jotka kuvasivat
hoitoprosessin viivettä. Viiveen syihin liittyviä kirjauksia oli 329. Näistä muodostettiin kuusi
yläkategoriaa: tilat ja välineet, henkilöstön koordinointi, henkilökunnan työtaistelu, työntekijöiden
ammattitaito ja muut harvoin esiintyvät syyt. Selkeä enemmistö viiveen syistä liittyi tiloihin ja
välineisiin (n=212). Hoitoprosessivaiheittain tarkasteltuna suurin osa viiveestä liittyi sairaalasiirtoihin
(n=187).
Tutkimuksen perusteella tiedetään, että hoitoprosessin viiveistä ja niihin liittyvistä syistä kirjataan
potilasasiakirjoihin ja niitä on mahdollista tunnistaa ja luokitella kirjausten perusteella. Tulosten
pohjalta luotiin sanasto, jota voidaan hyödyntää jatkotutkimuksissa kehitettäessä NLP:hen pohjautuvia
menetelmiä tunnistamaan tai ennustamaan hoitoprosessin viivettä. Delays in patient care processes can cause harm to both patients and personnel and incur additional
costs to healthcare provider. Cardiovascular diseases are a significant public health issue and one of
the most common reasons for inpatient care in tertiary referral hospitals, making it essential to address
delays in the treatment of cardiac patients. One emerging technology in the healthcare field is natural
language processing (NLP), which can be useful in identifying and predicting delays in patient care.
NLP uses various data modeling techniques, such as vocabularies. Manually annotated vocabularies
enhance the reliability of NLP-based tools or are even a necessity for those to function more accurate.
The purpose of this study was to describe the delays in patient care processes documented in the
records of cardiac patients and the recorded underlying causes of these delays. The goal was to create
a vocabulary from the expressions in the patient documents that could be used in future research to
develop NLP-based methods for identifying or predicting delays in patient care processes.
This retrospective patient record analysis consisted of electronic patient records from a tertiary
hospital. Cluster sampling (n=479,228) was initially performed with words and phrases describing
delays. From this group, a random sample of 300 patients was taken. The patient records included
entries from doctors, nurses, and other healthcare professionals involved in the treatment. The data
was analysed using deductive content analysis, for which an analysis matrix was created based on a
literature review. Subsequently, the data was annotated using the BRAT annotation tool. Data
saturation was reached with 200 patients, at which point annotation was stopped. The analysis
continued with inductive categorisation and statistical methods.
A total of 62,365 documents were analysed. The data contained 391 expressions describing delays in
patient care processes. There were 329 entries related to the causes of the delays. Six main categories
were formed from these: facilities and equipment, employee coordination, employees labour disputes,
employee skills, and other rare causes. The majority of delay causes were related to facilities and
equipment (n=212). When examined by care process phase, most of the delays were related to hospital
transfers (n=187).
The study shows that delays in care processes and their underlying causes are documented in patient
records and can be identified and classified based on these entries. Based on the annotations, a
vocabulary was created that can be used in further research to develop NLP-based methods for
identifying or predicting delays in care processes.
lisäkustannuksia terveydenhuollolle. Sydän- ja verisuonisairaudet ovat merkittävä kansantauti ja yksi
yleisimmistä syistä erikoissairaanhoidon vuodeosastohoidolle, joten on olennaista pyrkiä vaikuttamaan
sydänpotilaiden hoitoprosessin viiveisiin. Yksi nouseva teknologia terveydenhuollon kentällä on
luonnollisen kielen käsittely (NLP), joka voi olla hyödyksi viiveiden tunnistamisessa ja
ennustamisessa. Toimiakseen NLP käyttää erilaisia tietomallinnuksen keinoja, kuten sanastoja.
Manuaalisesti annotoidut sanastot lisäävät NLP-pohjaisen työkalun luotettavuutta tai on jopa edellytys
sen tarkemmalle toiminnalle.
Tutkimuksen tarkoituksena oli kuvata sydänpotilaiden potilasasiakirjoihin kirjattuja hoitoprosessin
viiveitä ja niihin liittyviä kirjattuja syitä. Tavoitteena oli muodostaa potilasasiakirjojen ilmauksista
sanasto, jota hyödyntämällä voidaan NLP:n avulla tulevaisuudessa tunnistaa tai ennustaa
potilasasiakirjoista automaattisesti ja reaaliaikaisesti hoitoprosessin viive ja sen mahdollisia syitä.
Tutkimusasetelmana oli retrospektiivinen potilasasiakirja-analyysi. Tutkimusaineistona oli yhden
yliopistosairaalan sähköiset potilasasiakirjat. Aineistosta tehtiin ensin klusteriotanta (n=479 228)
viivettä kuvaavien sanojen ja fraasien avulla. Tästä joukosta otettiin satunnaisotannalla 300 potilaan
otos. Potilasasiakirjat käsittivät lääkärien, sairaanhoitajien ja muiden hoitoon osallistuvien
ammattilaisten kirjaukset. Aineisto analysoitiin deduktiivisen sisällönanalyysin menetelmin, jota
varten muodostettiin analyysimatriisi kirjallisuuskatsauksen pohjalta. Tämän jälkeen aineisto
annotoitiin BRAT-annotointityökalun avulla. Aineisto saturoitui 200 potilaan kohdalla, jolloin
annotointi lopetettiin. Analyysiä jatkettiin vielä induktiivisella luokittelulla ja tilastollisilla
menetelmillä.
Analysoituja merkintöjä oli yhteensä 62 365. Aineistosta löytyi 391 ilmausta, jotka kuvasivat
hoitoprosessin viivettä. Viiveen syihin liittyviä kirjauksia oli 329. Näistä muodostettiin kuusi
yläkategoriaa: tilat ja välineet, henkilöstön koordinointi, henkilökunnan työtaistelu, työntekijöiden
ammattitaito ja muut harvoin esiintyvät syyt. Selkeä enemmistö viiveen syistä liittyi tiloihin ja
välineisiin (n=212). Hoitoprosessivaiheittain tarkasteltuna suurin osa viiveestä liittyi sairaalasiirtoihin
(n=187).
Tutkimuksen perusteella tiedetään, että hoitoprosessin viiveistä ja niihin liittyvistä syistä kirjataan
potilasasiakirjoihin ja niitä on mahdollista tunnistaa ja luokitella kirjausten perusteella. Tulosten
pohjalta luotiin sanasto, jota voidaan hyödyntää jatkotutkimuksissa kehitettäessä NLP:hen pohjautuvia
menetelmiä tunnistamaan tai ennustamaan hoitoprosessin viivettä.
costs to healthcare provider. Cardiovascular diseases are a significant public health issue and one of
the most common reasons for inpatient care in tertiary referral hospitals, making it essential to address
delays in the treatment of cardiac patients. One emerging technology in the healthcare field is natural
language processing (NLP), which can be useful in identifying and predicting delays in patient care.
NLP uses various data modeling techniques, such as vocabularies. Manually annotated vocabularies
enhance the reliability of NLP-based tools or are even a necessity for those to function more accurate.
The purpose of this study was to describe the delays in patient care processes documented in the
records of cardiac patients and the recorded underlying causes of these delays. The goal was to create
a vocabulary from the expressions in the patient documents that could be used in future research to
develop NLP-based methods for identifying or predicting delays in patient care processes.
This retrospective patient record analysis consisted of electronic patient records from a tertiary
hospital. Cluster sampling (n=479,228) was initially performed with words and phrases describing
delays. From this group, a random sample of 300 patients was taken. The patient records included
entries from doctors, nurses, and other healthcare professionals involved in the treatment. The data
was analysed using deductive content analysis, for which an analysis matrix was created based on a
literature review. Subsequently, the data was annotated using the BRAT annotation tool. Data
saturation was reached with 200 patients, at which point annotation was stopped. The analysis
continued with inductive categorisation and statistical methods.
A total of 62,365 documents were analysed. The data contained 391 expressions describing delays in
patient care processes. There were 329 entries related to the causes of the delays. Six main categories
were formed from these: facilities and equipment, employee coordination, employees labour disputes,
employee skills, and other rare causes. The majority of delay causes were related to facilities and
equipment (n=212). When examined by care process phase, most of the delays were related to hospital
transfers (n=187).
The study shows that delays in care processes and their underlying causes are documented in patient
records and can be identified and classified based on these entries. Based on the annotations, a
vocabulary was created that can be used in further research to develop NLP-based methods for
identifying or predicting delays in care processes.