Historiallisten Peruskarttojen syväoppiva karttaprosessointi : Pellot ja suot Suomessa 1949–1978
Seppä, Iiro (2024-05-02)
Historiallisten Peruskarttojen syväoppiva karttaprosessointi : Pellot ja suot Suomessa 1949–1978
Seppä, Iiro
(02.05.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024061048683
https://urn.fi/URN:NBN:fi-fe2024061048683
Tiivistelmä
Historialliset kartat sisältävät paljon arvokasta tietoa menneiden aikojen maankäytöstä. Tämän takia
skannattujen karttojen muuttamista paikkatiedoksi, eli karttaprosessointia on tutkittu jo pitkään.
Suomalaisia peruskarttoja on tosin karttaprosessoitu vain yhdessä aiemmassa tutkimuksessa, joka oli
hyvin pienialainen. Tämän tutkielman tavoitteena oli laajentaa tämä alue peltojen ja ojitettujen sekä
ojittamattomien soiden osalta kattamaan kaikki ensimmäisen valtakunnan peruskartoituksen aikana
tuotetut ja myöhemmin skannatut peruskartat, eli lähes koko Suomen alue. Lisäksi tavoitteena oli
arvioida tuotetun aineiston käyttökelpoisuutta.
Aluksi skannatut kartat georeferoitiin, ja georeferoinnin tarkkuus mitattiin. Tämän jälkeen digitoitiin
käsin 359 km2 koulutusaineistoa. Seuraavaksi syväoppiva konvoluutioneuroverkko, joka pohjautui U-
net-arkkitehtuuriin, opetettiin tunnistamaan pellot sekä ojitetut ja ojittamattomat suot kaikista ennen
vuotta 1979 valmistuneista peruskarttalehdistä, ja koulutuksen laatu arvioitiin. Lopuksi koulutetulla
mallilla prosessoitiin 3090 peruskarttalehteä, jotka jälkikäsiteltin ja kursittiin yhdeksi yhtenäiseksi
aineistoksi.
Mallin kokonaistarkkuus oli 96,6 % ja Cohenin kappa oli 0,93. Georeferoitujen karttakohteiden
sijaintivirheet olivat pääasiassa noin kymmenen metrin luokkaa. Tuotetun osituksen laatu vastaa
aiemmassa tutkimuksessa peruskartoille tehtyä karttaprosessointia, mutta on tehty yli 300 kertaa
suuremmalle alueelle.
Tuotettu aineisto tarjoaa mahdollisuuksia monenlaiseen peltojen ja soiden muutosten tutkimukseen
1950-luvulta eteenpäin. Historical maps include plenty of valuable information about land usage in times past. Therefore
transforming scanned maps to digital geospatial data, also called map processing, has been researched
for a long time. Despite this, there has been only one previous study, that has map processed historical
Finnish Basic maps, and its study area was relatively limited. The objective of this Master's thesis was
to expand the map processed area to cover almost the entire Finland, matching the extent of the first
Basic mapping of Finland. Additional goal was to assess the usability of the produced dataset. The
land use classes that were the focus of the study were fields, drained mires and undrained mires.
At first, the scanned maps were georeferenced, and the accuracy of the georeferencing was measured.
Following that, 359 km2 of the maps were digitized manually to create a training dataset. Next, a deep
learning convolutional neural network based on the U-net architecture was trained to extract the fields,
drained mires and undrained mires from the scanned maps, and the performance was evaluated.
Finally the trained model was used to process 3090 Basic map sheets, and the results were
postprocessed and combined to one dataset.
The total accuracy of the model was 96,6 %, and the Cohen's kappa was 0,93. Location accuracy of
the georeferenced map objects was usually around 10 m. The produced segmentation's quality matches
or exceeds the previous study on map processing Finnish Basic maps, but covers an area that is 300
times larger.
The produced dataset provides opportunities for many types of land use change research that concerns
fields and mires from 1950's onward.
skannattujen karttojen muuttamista paikkatiedoksi, eli karttaprosessointia on tutkittu jo pitkään.
Suomalaisia peruskarttoja on tosin karttaprosessoitu vain yhdessä aiemmassa tutkimuksessa, joka oli
hyvin pienialainen. Tämän tutkielman tavoitteena oli laajentaa tämä alue peltojen ja ojitettujen sekä
ojittamattomien soiden osalta kattamaan kaikki ensimmäisen valtakunnan peruskartoituksen aikana
tuotetut ja myöhemmin skannatut peruskartat, eli lähes koko Suomen alue. Lisäksi tavoitteena oli
arvioida tuotetun aineiston käyttökelpoisuutta.
Aluksi skannatut kartat georeferoitiin, ja georeferoinnin tarkkuus mitattiin. Tämän jälkeen digitoitiin
käsin 359 km2 koulutusaineistoa. Seuraavaksi syväoppiva konvoluutioneuroverkko, joka pohjautui U-
net-arkkitehtuuriin, opetettiin tunnistamaan pellot sekä ojitetut ja ojittamattomat suot kaikista ennen
vuotta 1979 valmistuneista peruskarttalehdistä, ja koulutuksen laatu arvioitiin. Lopuksi koulutetulla
mallilla prosessoitiin 3090 peruskarttalehteä, jotka jälkikäsiteltin ja kursittiin yhdeksi yhtenäiseksi
aineistoksi.
Mallin kokonaistarkkuus oli 96,6 % ja Cohenin kappa oli 0,93. Georeferoitujen karttakohteiden
sijaintivirheet olivat pääasiassa noin kymmenen metrin luokkaa. Tuotetun osituksen laatu vastaa
aiemmassa tutkimuksessa peruskartoille tehtyä karttaprosessointia, mutta on tehty yli 300 kertaa
suuremmalle alueelle.
Tuotettu aineisto tarjoaa mahdollisuuksia monenlaiseen peltojen ja soiden muutosten tutkimukseen
1950-luvulta eteenpäin.
transforming scanned maps to digital geospatial data, also called map processing, has been researched
for a long time. Despite this, there has been only one previous study, that has map processed historical
Finnish Basic maps, and its study area was relatively limited. The objective of this Master's thesis was
to expand the map processed area to cover almost the entire Finland, matching the extent of the first
Basic mapping of Finland. Additional goal was to assess the usability of the produced dataset. The
land use classes that were the focus of the study were fields, drained mires and undrained mires.
At first, the scanned maps were georeferenced, and the accuracy of the georeferencing was measured.
Following that, 359 km2 of the maps were digitized manually to create a training dataset. Next, a deep
learning convolutional neural network based on the U-net architecture was trained to extract the fields,
drained mires and undrained mires from the scanned maps, and the performance was evaluated.
Finally the trained model was used to process 3090 Basic map sheets, and the results were
postprocessed and combined to one dataset.
The total accuracy of the model was 96,6 %, and the Cohen's kappa was 0,93. Location accuracy of
the georeferenced map objects was usually around 10 m. The produced segmentation's quality matches
or exceeds the previous study on map processing Finnish Basic maps, but covers an area that is 300
times larger.
The produced dataset provides opportunities for many types of land use change research that concerns
fields and mires from 1950's onward.