Governance of Platform Data : From Canonical Data Models to Federative Interoperability
Nokkala, Tiina (2020-09-11)
Governance of Platform Data : From Canonical Data Models to Federative Interoperability
Nokkala, Tiina
(11.09.2020)
Turun yliopisto. Turun kauppakorkeakoulu
Julkaisun pysyvä osoite on:
https://urn.fi/URN:ISBN:978-951-29-8133-5
https://urn.fi/URN:ISBN:978-951-29-8133-5
Tiivistelmä
ABSTRACT
As the volume of data generated every day is constantly increasing and, at the same time, ever more complex business networks are using this voluminous data, there is a clear need for better data governance. So far, the academic and practical literature has focused mainly on data governance for intra-organisational purposes. However, in the era of multifaceted business networks and with a rising number of data-driven platforms, the scope of data governance needs to be widened to address interorganisational contexts. From a practical point of view, data on the same subjects are scattered across numerous information systems and attempts to integrate them are often unsuccessful. Thus, new approaches are needed.
The object of this dissertation is to study data governance in platform contexts. The goal is to use the existing data governance frameworks as a basis for creating a new framework that encompasses aspects of the networked business and network and platform business models, and the specific features related to data sharing on platforms.
Three independent qualitative case studies were conducted to collect empirical evidence for this dissertation. The first case was about data federation in breast cancer patient and treatment data. The other two cases were conducted in the maritime industry to find out how data should be governed on platforms and what aspects affect the willingness of participating organisations to share data on platforms. The qualitative data consists of interviews with 29 people, material from several workshops, and group discussions and interview journals kept during the data collection. The theory building is based on the existing literature on data governance, networks and platforms and on the results of the case studies conducted.
The key theoretical contributions of this dissertation are threefold. First, a federative approach to data interoperability is presented, with related tools. The federative approach enables preserving the original and other contexts of data and is based on the use of metadata to explain the various meanings of data. Second, a platform data governance model that includes business model aspects for networks is proposed. This model considers data federation as a means of joining the network and the platform, and has a special focus on data access and ownership. Third and most importantly, this dissertation joins the discussion on whether data is universally or contextually defined by presenting new views on the latter position. The idea is that instead of aiming for objective definitions for data, data should be seen as the representation of facts in their contexts that affect how the facts should be seen. In data-sharing situations, there should be agreements on what data means and how it should be understood. These agreements can be stored as metadata for the data entries. There should be three types of metadata, i.e. information system (IS) technical, information processing and socio-contextual metadata, in order to give a thorough explanation of the meaning of the data.
This dissertation provides new insights into how data sharing in networked business environments could be arranged, taking into account the ownership and access issues of data, especially in the platform context. This study also widens the understanding of the ontological nature of data in more complex IS environments. So far, the academic literature on platform data governance is sparse, and that on data governance in general has focused more on data management functions and considered data to have universal definitions. On the practical side, the framework presents methods for implementing data governance policies on platforms and offers federative tools that are feasible for actual data integration.
KEYWORDS: Data, Data governance, Platforms, Networks, Data federation, Data interoperability TIIVISTELMÄ
Syntyvän, luotavan ja tallennettavan datan määrä kasvaa yhä kiihtyvällä tahdilla, ja samanaikaisesti yhä monimutkaisemmat liiketoimintaverkostot haluavat hyödyntää näitä valtavia datamassoja. Tämän takia tarvitaan kattavampaa ja kokonaisvaltaisempaa tiedonhallintaa. Aiempi kirjallisuus on käsitellyt tiedonhallintaa pääasiassa organisaation sisäisestä näkökulmasta. Kasvavien ja monitahoistuvien liiketoimintaverkostojen, sekä erilaisten datavetoisten alustojen aikakautena tiedonhallinta tulee ulottaa koskemaan myös organisaatioiden välisiä konteksteja. Käytännön näkökulmasta tarve tiedonhallinnalle nousee samoja objekteja koskevan tiedon hajaantumisesta useisiin järjestelmiin ja organisaatioihin. Tämän hajaantuneen tiedon integraatioyritykset ovat usein epäonnistuneita ja siksi uudenlaisia lähestymistapoja tarvitaan.
Tässä väitöskirjassa tiedonhallintaa tutkitaan alustakontekstissa. Tavoitteena on olemassa olevia tiedonhallinnan viitekehyksiä lähtökohtana käyttäen luoda uusi viitekehys, joka huomioi verkostomaisen liiketoiminnan, verkosto- ja alustaliiketoimintamallit sekä alustoilla tapahtuvaan tiedonjakoon liittyvät erityispiirteet.
Väitöskirjaan sisältyy kolme itsenäistä tapaustutkimusta, joissa on kerätty tutkielman empiirinen aineisto. Ensimmäinen tapaustutkimus koskee rintasyöpäpotilaita ja heidän hoitoaan koskevan datan federaatiota. Kaksi muuta tapaustutkimusta toteutettiin meriteollisuudessa. Näiden kahden tapaustutkimuksen tavoitteena oli selvittää miten dataa tulisi hallinnoida alustoilla ja mitkä tekijät vaikuttavat organisaatioiden halukkuuteen jakaa tietoa digitaalisilla alustoilla. Laadullinen aineisto koostuu yhteensä 29 henkilöhaastattelusta, useiden työpajojen materiaalista, ryhmäkeskusteluista sekä aineistonkeruun aikana pidetyistä haastattelupäiväkirjoista. Tutkimuksen teoreettisen kontribuution rakentuminen pohjautuu siis aiempaan tiedonhallintakirjallisuuteen, kirjallisuuteen verkostoista ja alustoista sekä kolmen toteutetun tapaustutkimuksen tuloksiin.
Väitöskirjan teoreettinen kontribuutio jakautuu kolmeen osaan. Ensiksi esitellään federatiivinen lähestymistapa tiedon yhteen toimivuuteen ja tähän liittyviä työkaluja. Federatiivinen lähestymistapa mahdollistaa datan alkuperäisen ja muiden kontekstien samanaikaisen säilyttämisen sekä datan eri merkitysten ymmärtämisen metadataan perustuen. Toiseksi esitellään ehdotus tiedonhallintamalliksi digitaalisille alustoille. Tämä malli huomioi verkostomaisen liiketoiminnan erityispiirteet. Ehdotetussa tiedonhallintamallissa datafederaatio nähdään tapana liittyä dataa jakavaan verkostoon ja alustalle. Erityistä huomiota kiinnitetään datan käyttöoikeuksiin ja omistajuuteen. Kolmanneksi väitöskirja osallistuu keskusteluun datan luonteen määrittelystä: onko data universaalisti vai kontekstuaalisesti määriteltyä. Väitöskirjassa esitellään jälkimmäistä näkökulmaa puoltavia uusia tekijöitä. Pyrkimyksenä on objektiivisen datan määrittelyn sijaan nähdä datan kuvaavan tosiasioita erinäisissä konteksteissa. Nämä kontekstit vaikuttavat siihen, miten kyseiset tosiasiat tulee ymmärtää. Dataa jaettaessa on sovittava, mitä data tarkoittaa nämä kontekstit huomioiden. Nämä sopimukset voidaan tallentaa dataan liitettävänä metatietona. Datan merkityksen selvittämiseen perinpohjaisesti metatietoa tulisi olla kolmea eri tyyppiä: tietojärjestelmien teknistä, tiedon käsittelyyn liittyvää sekä sosio-kontekstuaalista metatietoa.
Tutkimuksessa esitellään uusia näkökulmia datan jakamiseen verkottuneissa liiketoimintaympäristöissä datan omistajuuteen ja saatavuuteen liittyvät tekijät huomioiden. Erityinen painopiste on alustakontekstissa. Lisäksi tutkimus lisää ymmärrystä datan ontologisesta luonteesta monimutkaisemmissa tietojärjestelmäympäristöissä. Tähänastinen akateeminen kirjallisuus tiedonhallinnasta on ollut niukkaa, keskittyen pääasiassa tiedon johtamisen eri toimintoihin. Lisäksi taustaoletuksena on ollut, että data on universaalisti määriteltyä. Käytännölliseltä kannalta väitöskirjassa esiteltävä viitekehys tarjoaa menetelmiä tiedonhallinnan toimintaperiaatteiden implementointiin digitaalisilla alustoilla. Lisäksi esitellään federatiivisia työkaluja, jotka soveltuvat käytännön dataintegraatioihin.
ASIASANAT: Data, Tiedonhallinta, Alustat, Liiketoimintaverkostot, Datafederaatio, Datan yhteentoimivuus
As the volume of data generated every day is constantly increasing and, at the same time, ever more complex business networks are using this voluminous data, there is a clear need for better data governance. So far, the academic and practical literature has focused mainly on data governance for intra-organisational purposes. However, in the era of multifaceted business networks and with a rising number of data-driven platforms, the scope of data governance needs to be widened to address interorganisational contexts. From a practical point of view, data on the same subjects are scattered across numerous information systems and attempts to integrate them are often unsuccessful. Thus, new approaches are needed.
The object of this dissertation is to study data governance in platform contexts. The goal is to use the existing data governance frameworks as a basis for creating a new framework that encompasses aspects of the networked business and network and platform business models, and the specific features related to data sharing on platforms.
Three independent qualitative case studies were conducted to collect empirical evidence for this dissertation. The first case was about data federation in breast cancer patient and treatment data. The other two cases were conducted in the maritime industry to find out how data should be governed on platforms and what aspects affect the willingness of participating organisations to share data on platforms. The qualitative data consists of interviews with 29 people, material from several workshops, and group discussions and interview journals kept during the data collection. The theory building is based on the existing literature on data governance, networks and platforms and on the results of the case studies conducted.
The key theoretical contributions of this dissertation are threefold. First, a federative approach to data interoperability is presented, with related tools. The federative approach enables preserving the original and other contexts of data and is based on the use of metadata to explain the various meanings of data. Second, a platform data governance model that includes business model aspects for networks is proposed. This model considers data federation as a means of joining the network and the platform, and has a special focus on data access and ownership. Third and most importantly, this dissertation joins the discussion on whether data is universally or contextually defined by presenting new views on the latter position. The idea is that instead of aiming for objective definitions for data, data should be seen as the representation of facts in their contexts that affect how the facts should be seen. In data-sharing situations, there should be agreements on what data means and how it should be understood. These agreements can be stored as metadata for the data entries. There should be three types of metadata, i.e. information system (IS) technical, information processing and socio-contextual metadata, in order to give a thorough explanation of the meaning of the data.
This dissertation provides new insights into how data sharing in networked business environments could be arranged, taking into account the ownership and access issues of data, especially in the platform context. This study also widens the understanding of the ontological nature of data in more complex IS environments. So far, the academic literature on platform data governance is sparse, and that on data governance in general has focused more on data management functions and considered data to have universal definitions. On the practical side, the framework presents methods for implementing data governance policies on platforms and offers federative tools that are feasible for actual data integration.
KEYWORDS: Data, Data governance, Platforms, Networks, Data federation, Data interoperability
Syntyvän, luotavan ja tallennettavan datan määrä kasvaa yhä kiihtyvällä tahdilla, ja samanaikaisesti yhä monimutkaisemmat liiketoimintaverkostot haluavat hyödyntää näitä valtavia datamassoja. Tämän takia tarvitaan kattavampaa ja kokonaisvaltaisempaa tiedonhallintaa. Aiempi kirjallisuus on käsitellyt tiedonhallintaa pääasiassa organisaation sisäisestä näkökulmasta. Kasvavien ja monitahoistuvien liiketoimintaverkostojen, sekä erilaisten datavetoisten alustojen aikakautena tiedonhallinta tulee ulottaa koskemaan myös organisaatioiden välisiä konteksteja. Käytännön näkökulmasta tarve tiedonhallinnalle nousee samoja objekteja koskevan tiedon hajaantumisesta useisiin järjestelmiin ja organisaatioihin. Tämän hajaantuneen tiedon integraatioyritykset ovat usein epäonnistuneita ja siksi uudenlaisia lähestymistapoja tarvitaan.
Tässä väitöskirjassa tiedonhallintaa tutkitaan alustakontekstissa. Tavoitteena on olemassa olevia tiedonhallinnan viitekehyksiä lähtökohtana käyttäen luoda uusi viitekehys, joka huomioi verkostomaisen liiketoiminnan, verkosto- ja alustaliiketoimintamallit sekä alustoilla tapahtuvaan tiedonjakoon liittyvät erityispiirteet.
Väitöskirjaan sisältyy kolme itsenäistä tapaustutkimusta, joissa on kerätty tutkielman empiirinen aineisto. Ensimmäinen tapaustutkimus koskee rintasyöpäpotilaita ja heidän hoitoaan koskevan datan federaatiota. Kaksi muuta tapaustutkimusta toteutettiin meriteollisuudessa. Näiden kahden tapaustutkimuksen tavoitteena oli selvittää miten dataa tulisi hallinnoida alustoilla ja mitkä tekijät vaikuttavat organisaatioiden halukkuuteen jakaa tietoa digitaalisilla alustoilla. Laadullinen aineisto koostuu yhteensä 29 henkilöhaastattelusta, useiden työpajojen materiaalista, ryhmäkeskusteluista sekä aineistonkeruun aikana pidetyistä haastattelupäiväkirjoista. Tutkimuksen teoreettisen kontribuution rakentuminen pohjautuu siis aiempaan tiedonhallintakirjallisuuteen, kirjallisuuteen verkostoista ja alustoista sekä kolmen toteutetun tapaustutkimuksen tuloksiin.
Väitöskirjan teoreettinen kontribuutio jakautuu kolmeen osaan. Ensiksi esitellään federatiivinen lähestymistapa tiedon yhteen toimivuuteen ja tähän liittyviä työkaluja. Federatiivinen lähestymistapa mahdollistaa datan alkuperäisen ja muiden kontekstien samanaikaisen säilyttämisen sekä datan eri merkitysten ymmärtämisen metadataan perustuen. Toiseksi esitellään ehdotus tiedonhallintamalliksi digitaalisille alustoille. Tämä malli huomioi verkostomaisen liiketoiminnan erityispiirteet. Ehdotetussa tiedonhallintamallissa datafederaatio nähdään tapana liittyä dataa jakavaan verkostoon ja alustalle. Erityistä huomiota kiinnitetään datan käyttöoikeuksiin ja omistajuuteen. Kolmanneksi väitöskirja osallistuu keskusteluun datan luonteen määrittelystä: onko data universaalisti vai kontekstuaalisesti määriteltyä. Väitöskirjassa esitellään jälkimmäistä näkökulmaa puoltavia uusia tekijöitä. Pyrkimyksenä on objektiivisen datan määrittelyn sijaan nähdä datan kuvaavan tosiasioita erinäisissä konteksteissa. Nämä kontekstit vaikuttavat siihen, miten kyseiset tosiasiat tulee ymmärtää. Dataa jaettaessa on sovittava, mitä data tarkoittaa nämä kontekstit huomioiden. Nämä sopimukset voidaan tallentaa dataan liitettävänä metatietona. Datan merkityksen selvittämiseen perinpohjaisesti metatietoa tulisi olla kolmea eri tyyppiä: tietojärjestelmien teknistä, tiedon käsittelyyn liittyvää sekä sosio-kontekstuaalista metatietoa.
Tutkimuksessa esitellään uusia näkökulmia datan jakamiseen verkottuneissa liiketoimintaympäristöissä datan omistajuuteen ja saatavuuteen liittyvät tekijät huomioiden. Erityinen painopiste on alustakontekstissa. Lisäksi tutkimus lisää ymmärrystä datan ontologisesta luonteesta monimutkaisemmissa tietojärjestelmäympäristöissä. Tähänastinen akateeminen kirjallisuus tiedonhallinnasta on ollut niukkaa, keskittyen pääasiassa tiedon johtamisen eri toimintoihin. Lisäksi taustaoletuksena on ollut, että data on universaalisti määriteltyä. Käytännölliseltä kannalta väitöskirjassa esiteltävä viitekehys tarjoaa menetelmiä tiedonhallinnan toimintaperiaatteiden implementointiin digitaalisilla alustoilla. Lisäksi esitellään federatiivisia työkaluja, jotka soveltuvat käytännön dataintegraatioihin.
ASIASANAT: Data, Tiedonhallinta, Alustat, Liiketoimintaverkostot, Datafederaatio, Datan yhteentoimivuus
Kokoelmat
- Väitöskirjat [2825]