dc.contributor.author | Nuutinen, Viljami | |
dc.date.accessioned | 2024-06-24T21:30:29Z | |
dc.date.available | 2024-06-24T21:30:29Z | |
dc.date.issued | 2024-06-19 | |
dc.identifier.uri | https://www.utupub.fi/handle/10024/178556 | |
dc.description.abstract | Materiaali-informatiikka on materiaalitieteen haara, jossa hyödynnetään laskennallisia metodeja materiaalien ja niiden ominaisuuksien tutkimiseen ja kehittämiseen. Materiaali-informatiikan tutkimus vaatii kuitenkin suuria määriä dataa, jonka saatavuus on haastavaa johtuen materiaalitieteiden tietokantojen vajavaisuudesta. Materiaalitieteen julkaisujen määrä kasvaa jatkuvasti, mutta alan monimuotoisuuden vuoksi tiedon esittämistavat ovat vaihtelevia ja halutun tiedon löytäminen työlästä.
Suurilla kielimalleilla (kuten BERT (Bidirectional Encoder Representations from Transformers) tai GPT (Generative Pre-trained Transformer)), voidaan analysoida suuria määriä tekstiä automaattisesti ja eristää niistä arvokasta dataa materiaaleista, josta voidaan luoda tietokantoja hyödynnettäväksi materiaali-informatiikan sovelluksissa. Tiedon eristäminen materiaalitieteiden teksteistä on haastavaa, koska erilaisia tutkittavia materiaaliluokkia on paljon ja merkintätavat vaihtelevat alalla. Teksti on myös vaikea datan laji, koska se voi esiintyä erilaisissa muotoiluissa, mikä mutkistaa sen käsittelyä.
Tutkielmassa tarjotaan katsaus kieliteknologioiden käyttöön materiaalitieteissä, aiheeseen liittyvään termistöön ja materiaalitekniikan käyttöön kehitettyihin kielimalleihin. Tutkielma keskittyy käsittelemään tekstimuotoista tiedon eristämistä BERT-kielimalleilla. Suurilla kielimalleilla tiedon eristäminen on materiaalitieteissä alkutekijöissään ja siihen liittyviä haasteita on paljon. Kieliteknologioiden kehittyessä tiedon eristäminen suurilla kielimalleilla on vaikeuksista huolimatta lupaava työkalu tulevaisuuden materiaalien kehityksessä. | |
dc.format.extent | 23 | |
dc.language.iso | fin | |
dc.rights | fi=Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.|en=This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.| | |
dc.subject | tiedon eristäminen, materiaali-informatiikka, suuret kielimallit, kieliteknologia | |
dc.title | Tiedon eristäminen materiaalitieteiden teksteistä suurilla kielimalleilla | |
dc.type.ontasot | fi=Kandidaatintutkielma|en=Bachelor's thesis| | |
dc.rights.accessrights | avoin | |
dc.identifier.urn | URN:NBN:fi-fe2024062457409 | |
dc.contributor.faculty | fi=Teknillinen tiedekunta|en=Faculty of Technology| | |
dc.contributor.studysubject | fi=Materiaalitekniikka|en=Materials Engineering| | |
dc.contributor.department | fi=Kone- ja materiaalitekniikan laitos|en=Department of Mechanical and Materials Engineering| | |