Tiedonhallintamallin vaikutus dataprojekteihin terveysteknologia-alan pk-yrityksissä
Rantanen, Jarkko (2023-05-16)
Tiedonhallintamallin vaikutus dataprojekteihin terveysteknologia-alan pk-yrityksissä
Rantanen, Jarkko
(16.05.2023)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2023052949375
https://urn.fi/URN:NBN:fi-fe2023052949375
Tiivistelmä
Henkilökohtaisten terveystietojen digitalisointi on lisääntynyt huomattavasti ja niiden hyödyntäminen data-analytiikassa on yleistynyt merkittävästi. Terveystietoja kertyy massiivisiin tietojoukkoihin, joita voidaan kutsua myös Big Dataksi. Tiedonhallintamallin muodostamisella pyritään hallitsemaan massiivisia tietojoukkoja ja sen tarkoituksena on kertoa mitä päätöksiä tiedonhallinnan ja käytön varmistamiseksi tehdään ja miten lisätään datasta hyödynnettävää arvoa sekä minimoidaan siihen liittyviä kustannuksia ja riskejä. Terveystietojen keräämisessä ja käsittelyssä on runsaasti potentiaalia, mutta tiedonhallintamallit eivät ole kyenneet pysymään tämän kehityksen tahdissa.
Tutkimus keskittyi selvittämään tiedonhallintamallin roolia, pk-yrityksissä, jotka kehittävät data analytiikkaratkaisuja terveydenhuollon ympäristöön. Tiedonhallintamallin käyttöönotto on tärkeää pk-yrityksille, jotta voidaan hallita paremmin suuria tietojoukkoja regulaatioiden ja vaatimusten mukaan sekä kehittää vaatimustenmukaisia data-analytiikkaratkaisuja. Vaatimustenmukaisuus on erityisen tärkeää terveydenhuoltoalan yhteydessä, koska pk-yrityksien tietojoukot sisältävät ihmisten terveyteen liittyviä tietoja. Tutkimuksen teoreettinen viitekehys muodostettiin kirjallisuuskatsauksen avulla ja se perustuu jo kehitettyihin tiedonhallintamalleihin, jotka ovat sopivia juuri dataprojektien ja terveystietojen hallinnan tarpeisiin. Lisäksi teoreettisesta viitekehyksestä pyrittiin tekemään sellainen, että sen osat ovat yhteensopivia CRISP-DM prosessimallin kanssa. CRISP-DM (englanniksi CRoss Industry Standard Process for Data Mining) on yleinen toimialasta riippumaton malli dataprojekteille, jonka avulla luodaan dataa hyödyntäviä analytiikka- ja tekoälyratkaisuja.
Tutkimuksen empiiristä osiota lähestyttiin laadullisesti ja tutkimusaineisto koostui viidestä teemahaastattelusta. Empiirisen tutkimuksen tulosten perusteella tarkennettiin vielä kirjallisuuskatsauksessa määriteltyä tiedonhallintamallin viitekehystä. Tuloksista kävi ilmi, että tiedonhallintamalli tulisi ottaa käyttöön terveysteknologia-alan pk-yrityksen ydintoiminnassa ja sen merkitys erityisesti kasvavalle yritykselle, jolla Big data -tietojoukkoja alkaa olla useita, on suuri. Tiedonhallintamallin puute muodostaa pullonkaulan kehitystyölle, jonka vuoksi dataprojektien eteneminen on hidasta. Jotta Big datan hyödyt saadaan kokonaisvaltaisemmin käyttöön, terveysteknologia-alan pk-yritykset tarvitsevat yhä parempia tiedonhallintamallin prosesseja. Merkittävä huomio tutkimuksessa oli se, että terveysteknologia-alan asiakkaiden vaatimusten täyttäminen on jo valmiiksi vaikeaa, mutta tutkimuksessa määritelty tiedonhallintamalli auttaa jäsentämään kokonaisuuden ja osoittamaan juuri niihin kohtiin, joihin resurssit kannattaa kohdistaa ennalta. Esimerkiksi tietojen varastointiin tarkoitetun palvelimen hankinta EU:n alueelta helpottaa merkittävästi sidosryhmien ja GDPR:n vaatimusten noudattamista, mikä nopeuttaa vaatimustenmukaisuuteen kuluvaa raskasta työtä ja vapauttaa aikaa pk-yritykselle mielekkäämpiin dataprojektivaiheisiin, kuten datan mallinnusvaiheeseen.
Tutkimus keskittyi selvittämään tiedonhallintamallin roolia, pk-yrityksissä, jotka kehittävät data analytiikkaratkaisuja terveydenhuollon ympäristöön. Tiedonhallintamallin käyttöönotto on tärkeää pk-yrityksille, jotta voidaan hallita paremmin suuria tietojoukkoja regulaatioiden ja vaatimusten mukaan sekä kehittää vaatimustenmukaisia data-analytiikkaratkaisuja. Vaatimustenmukaisuus on erityisen tärkeää terveydenhuoltoalan yhteydessä, koska pk-yrityksien tietojoukot sisältävät ihmisten terveyteen liittyviä tietoja. Tutkimuksen teoreettinen viitekehys muodostettiin kirjallisuuskatsauksen avulla ja se perustuu jo kehitettyihin tiedonhallintamalleihin, jotka ovat sopivia juuri dataprojektien ja terveystietojen hallinnan tarpeisiin. Lisäksi teoreettisesta viitekehyksestä pyrittiin tekemään sellainen, että sen osat ovat yhteensopivia CRISP-DM prosessimallin kanssa. CRISP-DM (englanniksi CRoss Industry Standard Process for Data Mining) on yleinen toimialasta riippumaton malli dataprojekteille, jonka avulla luodaan dataa hyödyntäviä analytiikka- ja tekoälyratkaisuja.
Tutkimuksen empiiristä osiota lähestyttiin laadullisesti ja tutkimusaineisto koostui viidestä teemahaastattelusta. Empiirisen tutkimuksen tulosten perusteella tarkennettiin vielä kirjallisuuskatsauksessa määriteltyä tiedonhallintamallin viitekehystä. Tuloksista kävi ilmi, että tiedonhallintamalli tulisi ottaa käyttöön terveysteknologia-alan pk-yrityksen ydintoiminnassa ja sen merkitys erityisesti kasvavalle yritykselle, jolla Big data -tietojoukkoja alkaa olla useita, on suuri. Tiedonhallintamallin puute muodostaa pullonkaulan kehitystyölle, jonka vuoksi dataprojektien eteneminen on hidasta. Jotta Big datan hyödyt saadaan kokonaisvaltaisemmin käyttöön, terveysteknologia-alan pk-yritykset tarvitsevat yhä parempia tiedonhallintamallin prosesseja. Merkittävä huomio tutkimuksessa oli se, että terveysteknologia-alan asiakkaiden vaatimusten täyttäminen on jo valmiiksi vaikeaa, mutta tutkimuksessa määritelty tiedonhallintamalli auttaa jäsentämään kokonaisuuden ja osoittamaan juuri niihin kohtiin, joihin resurssit kannattaa kohdistaa ennalta. Esimerkiksi tietojen varastointiin tarkoitetun palvelimen hankinta EU:n alueelta helpottaa merkittävästi sidosryhmien ja GDPR:n vaatimusten noudattamista, mikä nopeuttaa vaatimustenmukaisuuteen kuluvaa raskasta työtä ja vapauttaa aikaa pk-yritykselle mielekkäämpiin dataprojektivaiheisiin, kuten datan mallinnusvaiheeseen.