Taligenkänning av finlandssvenska och sverigesvenska : Utmaningar vid pluricentriska språk
Liipo, Elisa (2024-06-12)
Taligenkänning av finlandssvenska och sverigesvenska : Utmaningar vid pluricentriska språk
Liipo, Elisa
(12.06.2024)
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.
avoin
Julkaisun pysyvä osoite on:
https://urn.fi/URN:NBN:fi-fe2024061854622
https://urn.fi/URN:NBN:fi-fe2024061854622
Tiivistelmä
Denna avhandling behandlar pluricentriska språk ur taligenkänningssynvinkel. Svenska är ett pluricentriskt språk med två varianter, finlandssvenska och sverigesvenska. Syftet med min avhandling är att utreda hur ett taligenkänningsverktyg tolkar de två språkvarianterna, varför eventuella skillnader uppstår och i fall taligenkänningen gör samma feltolkningar vid båda språkvarianterna. Slutligen för jag en diskussion om hur taligenkänning kan vidareutvecklas.
Mitt material består av ljudklipp på finlandssvenska och sverigesvenska och taligenkännings tolkning av talet. Ljudklippen innehåller politiska debatter och diskussioner. Det finlandssvenska materialet består av 10 932 ord vilket motsvarar 88 minuter totalt och det sverigesvenska materialet består av 11 046 ord vilket motsvarar 68 minuter. Studien är både kvantitativ och kvalitativ till sin natur och jag kombinerar WER (word error rate) som metod med komparativa metoder.
Resultaten visar att det finns en tydlig skillnad i hur taligenkänning behandlar finlandssvenska och sverigesvenska. Den genomsnittliga WER-felprocenten var 0,14 % för finlandssvenska och 0,07 % för sverigesvenska. Det verkar som att den största faktorn som påverkar resultaten är mängden träningsdata. Eftersom taligenkänning kan användas som hjälpmedel av t.ex. äldre personer eller personer med funktionsnedsättning, måste detta uppmärksammas. Vi måste hitta lösningar för hur man kan insamla mer och bättre träningsdata även för icke-dominanta språkvarianter av pluricentriska språk. Detta är viktigt om vi ska kunna arbeta tillsammans för att bygga ett mer tillgängligt samhälle för alla dess invånare.
Mitt material består av ljudklipp på finlandssvenska och sverigesvenska och taligenkännings tolkning av talet. Ljudklippen innehåller politiska debatter och diskussioner. Det finlandssvenska materialet består av 10 932 ord vilket motsvarar 88 minuter totalt och det sverigesvenska materialet består av 11 046 ord vilket motsvarar 68 minuter. Studien är både kvantitativ och kvalitativ till sin natur och jag kombinerar WER (word error rate) som metod med komparativa metoder.
Resultaten visar att det finns en tydlig skillnad i hur taligenkänning behandlar finlandssvenska och sverigesvenska. Den genomsnittliga WER-felprocenten var 0,14 % för finlandssvenska och 0,07 % för sverigesvenska. Det verkar som att den största faktorn som påverkar resultaten är mängden träningsdata. Eftersom taligenkänning kan användas som hjälpmedel av t.ex. äldre personer eller personer med funktionsnedsättning, måste detta uppmärksammas. Vi måste hitta lösningar för hur man kan insamla mer och bättre träningsdata även för icke-dominanta språkvarianter av pluricentriska språk. Detta är viktigt om vi ska kunna arbeta tillsammans för att bygga ett mer tillgängligt samhälle för alla dess invånare.