tulokset
Silmäile
Julkaisuarkisto
UTUPub on Turun yliopiston avoin julkaisuarkisto, joka sisältää Turun yliopiston tiedekuntien ja laitosten julkaisuja ja opinnäytteitä kuten väitöskirjoja, lisensiaatintöitä, pro gradu -tutkielmia ja niiden tiivistelmiä sekä kandidaatintöitä.
Viimeksi lisätyt
- Ladataan...Application of the REINFORCE Algorithm in Real-Time Inverted Pendulum Control
DiplomityöPaldanius, Kimmo (2026-07-02)This thesis investigates the application of the REINFORCE policy-gradient algorithm to upright stabilization of the Quanser Qube-Servo 2 rotary inverted pendulum. Since the balancing task is approximately linear near the upright equilibrium, classical PD control already provides an effective solution. The aim is therefore not to show that REINFORCE outperforms classical control, but to examine whether a simple model-free reinforcement learning method can learn a local balancing policy, how the resulting controller compares with a PD reference controller, and how it behaves outside the training simulator. A Gym-compatible simulation environment was developed for the Furuta pendulum and used as the training environment. A continuous-action Gaussian policy was trained using a Monte Carlo REINFORCE update without a value-function baseline or critic network. The policy receives a compact two-dimensional feature representation formed from the arm and pendulum angles and angular velocities, and outputs the mean control action and state-dependent standard deviation. A simple survival reward encourages the policy to maximize balancing time. Both the learned policy and the PD reference controller were evaluated in the custom simulation, the Quanser virtual environment, and on the physical Qube-Servo 2 hardware. The results show that REINFORCE learns a local stabilizing policy that works in the virtual environment and on the physical device without retraining. Settled-state angular precision was broadly comparable to that of the PD controller, but the learned controller used a more active voltage signal and was less consistently reliable. The work demonstrates the feasibility of REINFORCE for this real-time control task while highlighting its sensitivity to task formulation and the limitations of transferring from simulation to the physical device.Tässä diplomityössä tutkitaan, voidaanko REINFORCE-vahvistusoppimisalgoritmia hyödyntää Quanser Qube-Servo 2 -pyörivän käänteisheilurin pystyasennon tasapainottamiseen. Koska tasapainotustehtävä on likimain lineaarinen pystyasennon tasapainopisteen lähellä, klassinen PD-säätö tarjoaa siihen jo tehokkaan ratkaisun. Työn tavoitteena ei siten ole osoittaa REINFORCE-algoritmin paremmuutta klassiseen säätöön nähden, vaan selvittää, voiko yksinkertainen mallivapaa vahvistusoppimismenetelmä oppia paikalliseen tasapainotukseen soveltuvan ohjauspolitiikan. Lisäksi työssä tarkastellaan, miten opittu säädin vertautuu PD-vertailusäätimeen ja miten se toimii koulutussimulaattorin ulkopuolella. Työtä varten kehitettiin Gym-yhteensopiva simulaatioympäristö pyörivälle käänteisheilurille. Säädin toteutettiin jatkuva-arvoisena stokastisena ohjauspoliti-ikkana, jossa ohjaustoiminto kuvataan gaussisen todennäköisyysjakauman avulla. Ohjauspolitiikka koulutettiin Monte Carlo -REINFORCE-päivityksellä ilman arvofunktioon perustuvaa vertailutasoa tai kriitikkoverkkoa. Ohjauspolitiikka saa syötteenään kaksi piirrettä, jotka muodostetaan varren ja heilurin kulmista sekä kulmanopeuksista, ja tuottaa ohjaustoiminnon keskiarvon sekä tilasta riippuvan keskihajonnan. Yksinkertainen tasapainossa pysymiseen perustuva palkkio ohjaa oppimista kohti mahdollisimman pitkää tasapainotusaikaa. Opittua säädintä ja PD-vertailusäädintä arvioitiin tätä työtä varten kehitetyssä simulaatioympäristössä, Quanserin virtuaaliympäristössä sekä fyysisellä Qube-Servo 2 -laitteella. Tulokset osoittavat, että REINFORCE oppii paikalliseen stabilointiin soveltuvan ohjauspolitiikan, joka toimii virtuaaliympäristössä ja fyysisellä laitteella ilman uudelleenkoulutusta. Vakiintuneessa tilassa kulmatarkkuus oli verrattavissa PD-säätimeen, mutta opitun säätimen ohjausjännite vaihteli enemmän ja sen toimintavarmuus oli heikompi. Työ osoittaa, että REINFORCE-algoritmia voidaan soveltaa tähän reaaliaikaiseen säätötehtävään, mutta tuo samalla esiin menetelmän herkkyyden oppimistehtävän määrittelylle sekä simulaatiosta fyysiselle laitteelle siirrettävyyden rajoitteet. - Ladataan...Design Framework for Trustworthy User Interfaces
DiplomityöPääkkönen, Iiro (2026-06-30)This thesis studies the relationship between user interface (UI) design, microinteractions and perceived trustworthiness in software systems. The thesis combines a narrative literature review with an empirical user study. The literature review gathers together research from trust psychology, human-computer interaction (HCI) and UI design to identify the most critical elements and decisions in UI design that contribute to trust formation. Based on already established trust models, such as the work of Mayer et al. and Hancock et al. the review finds functionality, helpfulness, predictability, visual trust signals and trust reinforcement actions as the core aspects of trustworthy UI design. Based on the literature review, the Trustworthy User Interface Design Framework (TUIDF) was created as a practical checklist for UI designers. To validate the framework, two mobile banking application prototypes were created using Figma Make, an artificial intelligence model made for UI design. The control prototype was designed using traditional UI design principles while the experiemental prototype was designed according to the TUIDF. Ten participants divided into two focus groups completed tasks to evaluate the prototypes with a questionnaire combining the STS and the System Usability Scale (SUS). The TUIDF-prototype scored higher on most dimensions that were measured, including purpose, process, visual appeal and general trust. This suggests that the framework can improve perceived trustworthiness. The findings show that UI design based on the TUIDF produces measurable improvements in user trust, although further validation with a larger sample size is required. - Ladataan...Mukautuva k-medoidiklusterointi ja valinnan jälkeinen päättely
Pro gradu -tutkielma | suljettuMurtomäki, Valtteri (2026-06-30)Tässä pro gradu -tutkielmassa tutkitaan ohjaamattoman oppimisen k-medoidimenetelmää ja erityisesti sen mukautuvaa BanditPAM-algoritmia. Alustusvaiheen odotusarvoinen kokonaisvaativuus on O(k n log n), sillä k alustusaskeleesta kukin vaatii odotusarvoisesti O(n log n) operaatiota. Myös vaihtovaiheen iteraation odotusarvoinen aikavaativuus on O(k n log n). Tulos saavutetaan soveltamalla monikätisten rosvojen viitekehystä ja yläluottamusrajoihin perustuvaa peräkkäistä eliminointia. Asymptoottisessa notaatiossa n edustaa havaintojen ja k klusterien lukumäärää. Aineistolähtöinen mallinvalinta altistaa kuitenkin tulokset valikoitumisharhalle, mikä vääristää nollajakaumia frekventistisessä päättelyssä ja kasvattaa ensimmäisen tyypin virheen todennäköisyyttä. Tutkielmassa arvioidaan, miten valikoitumisharhaa korjataan analyyttisesti valinnan jälkeisen päättelyn ja monitahokaslemman avulla. Tilastollista todistusvoimaa tarkastellaan Deborah Mayon ankaruusperiaatteen sekä Aris Spanoksen todennäköisyyspohjaisen pelkistämisen viitekehyksissä. Työn empiirisessä osiossa algoritmin ja analyyttisen korjauksen taustaoletuksia auditoidaan synteettisillä (normaalijakauma, Cauchyn jakauma, Studentin t-jakauma) sekä korkeaulotteisilla biologisilla yksisolutranskriptomiikan aineistoilla. Tutkielman tieteellinen kontribuutio on kaksiosainen. Ensimmäisenä kontribuutiona osoitetaan matemaattisesti ja empiirisesti, kuinka paksuhäntäisten aineistojen äärihavainnot vääristävät havaintoavaruuden mittasuhteita, mikä tekee mukautuvan otannan UCB-luottamusrajat liian leveiksi tehokasta karsintaa varten. Toisena metodologisena kontribuutiona tutkielma kytkee valinnan jälkeisen päättelyn polytooppikehyksen BanditPAM-algoritmin SWAP-vaiheeseen. Yliehdollistamista ehkäistään soveltamalla lokaalia seulontaa, joka yhdistää eksaktin teorian voittaja/toiseksi tullut -asetelman heuristiseen approksimaatioon ja parantaa siten testin tilastollista voimaa. Empiiriset tulokset osoittavat mukautuvissa k-medoidialgoritmeissa rakenteellisia rajoitteita. BanditPAM-algoritmin laskennallinen tehokkuus nojaa kapeisiin luottamusväleihin: paksuhäntäisillä aineistoilla yksittäiset äärihavainnot kasvattavat etäisyysmatriisin maksimiarvoa suhteettomasti. Yläluottamusrajoihin perustuva karsinta menettää tällöin käytännön tehokkuutensa, jolloin aikavaativuus palautuu neliölliselle O(k n²)-tasolle. Toinen merkittävä löydös kytkeytyy robustin tilastotieteen murtumispisteen teoriaan. Kun aineisto on paksuhäntäinen, yksittäiset äärihavainnot dominoivat etäisyysmatriisia deterministisesti. Oikein suoritettu bootstrap-analyysi paljastaa näiden rakenteiden epävakauden, sillä äärihavaintoihin nojaavat klusterit hajoavat otannan vaihdellessa. Algoritminen stabiilisuus on siten välttämätön, muttei riittävä ehto klusteroinnin validiteetille. Hajoamismekanismit osoittavat, että valinnan jälkeisen päättelyn analyyttiset menetelmät menettävät tilastollisen validiteettinsa ja robustiutensa, mikäli aineisto on spesifioitu virheellisesti. Ilmiö johtuu siitä, että menetelmät nojaavat vahvoihin parametrisiin oletuksiin. Näissä ääriolosuhteissa luotettava tilastollinen päättely edellyttää joko aineiston jakamista tai jakaumavapaita, algoritmiseen stabiilisuuteen perustuvia menetelmiä. Algoritmiseen stabiilisuuteen perustuva päättely tarjoaa ratkaisun ainoastaan niissä tapauksissa, joissa aineisto rikkoo normaalisuusoletuksen mutta täyttää edelleen stabiilisuustakuiden edellyttämät momenttiehdot. - Ladataan...Yrityksen sisäiset henkilöbrändit brändistrategisina resursseina : Sisäisten henkilöbrändisuhteiden muodostumisen merkitys ja johtaminen
Pro gradu -tutkielmaSarja, Susanna (2026-06-29)Sosiaalinen media ja kiristynyt kilpailu ovat muuttaneet tapaa, jolla brändejä rakennetaan. Muutokset toimintaympäristössä ovat johtaneet siihen, ettei yrityslähtöinen brändiviestintä enää riitä herättämään luottamusta. Samaan aikaan yhä useammat yrityksen sisäiset henkilöt, kuten yritysten johtajat ja muut työntekijät brändäävät itseään ja samalla rakentavat yritysbrändiä. Sisäisten henkilöbrändien ja yritysbrändin välinen synergia on kuitenkin vielä vasta vähän ymmärretty ilmiö. Aiempi tutkimus on keskittynyt tutkimaan johtajien ja työntekijöiden henkilöbrändäystä omina kokonaisuuksinaan suhteessa yritysbrändiin. Tämä tutkimus pyrki ymmärtämään ilmiötä kokonaisvaltaisemmin tuomalla eri tasojen henkilöbrändien kokemukset ja yritysten edustajien näkemykset yhteen. Tämän tutkimuksen tarkoituksena oli tarkastella yritysten ja sisäisten henkilöbrändien välisiä suhteita yritysten brändistrategisina resursseina. Näistä suhteista käytettiin käsitettä sisäinen henkilöbrändisuhde. Tutkimuksen tarkoitusta lähestyttiin tarkastelemalla, miten sisäiset henkilöbrändisuhteet muodostuvat, millaisia merkityksiä niillä voi olla yritykselle ja yksilölle, sekä miten niitä johdetaan. Tutkimuksella pyrittiin lisäämään ymmärrystä suhteista ja niiden johdettavuudesta, jotta suhteista saataisiin kestävää kilpailuetua. Tutkimuksen tavoitteen saavuttamiseksi nähtiin tärkeänä kuulla yksilöiden kokemuksia, koska se luo yrityksille ymmärrystä siitä, millaisina suhteet näyttäytyvät yksilöiden näkökulmista ja miten niitä voidaan johtaa molempia osapuolia hyödyttävällä tavalla. Tutkimus toteutettiin laadullisena haastattelututkimuksena. Haastattelut tehtiin hyödyntäen henkilöihin perustuvaa aineistotriangulaatiota, jossa kokemuksia tarkasteltiin kolmesta eri näkökulmasta: yritysten edustajien, johtotason henkilöbrändien sekä työntekijätason henkilöbrändien näkökulmista. Aineisto koostui yhteensä yhdeksästä haastattelusta, jotka analysoitiin teemoittelulla. Tutkimuksessa havaittiin sisäisten henkilöbrändisuhteiden olevan vastavuoroisia suhteita, jotka muodostuvat joko yritys- tai yksilölähtöisesti. Suhteisiin sisältyy kummallekin osapuolelle merkittäviä mahdollisuuksia, mutta myös haasteita. Havaintojen perusteella suhteita tulee johtaa suunnitelmallisesti, jopa strategisella otteella, kun niistä halutaan saada pidempiaikaista etua. Tämä tulisi tapahtua mahdollistavalla johtamisella, joka luo henkilöbrändisuhteille otolliset olosuhteet muodostua ja kehittyä. Kilpailuedun kannalta keskeistä havaittiin olevan yrityksen kyvykkyys ylläpitää sellaista suhteiden kokonaisuutta, jossa henkilöbrändit innostavat myös toinen toisiaan muodostamaan henkilöbrändisuhteita. Kestävän kilpailuedun havaittiin syntyvän syklisestä, itseään uudistavasta kokonaisuudesta, jossa yrityksestä aika ajoin poistuvat henkilöbrändit voivat korvautua uusilla henkilöbrändeillä, kun yritys ei nojaa vain yksittäisiin henkilöbrändeihin. Näin sisäinen henkilöbrändisuhde voidaan käsittää yrityksen brändistrategisena resurssina, jonka kestävä arvo rakentuu suuremman suhdekokonaisuuden ympärille yksittäisten suhteiden sijasta. - Ladataan...Dynamic Modelling and Simulation of a Single-Effect Absorption Chiller
DiplomityöSaha, Nilotpaul (2026-06-27)Absorption refrigeration systems driven by low-grade thermal energy offer a sustainable alternative to conventional vapour compression chillers, replacing the mechanical compressor with a thermochemical cycle driven primarily by waste heat (Florides et al., 2003). The lithium bromide– water (LiBr/H₂O) working pair is well-suited for single-effect cooling, operating effectively with heat source temperatures of 75–120 °C and making it directly compatible with marine waste heat applications (Salmi et al., 2017a). Because absorption machines possess large thermal inertia, dynamic simulation is essential for predicting transient responses, evaluating part-load performance, and designing effective control strategies (Kohlenbach and Ziegler, 2008a). This thesis presents the development and successful implementation of a dynamic, lumped-parameter simulation model for a single-effect LiBr/H₂O absorption chiller in MATLAB/Simulink. Following the state-space framework of Wen et al., (2019), the model is governed by coupled first-order ordinary differential equations derived from conservation of mass, species, and energy. Thermodynamic properties are computed using the correlations of Pátek and Klomfar, (2006) and Florides et al., (2003), with specific heat capacity derived as the analytical temperature derivative of the enthalpy correlation to ensure thermodynamic consistency. To overcome the numerical instability of the baseline model, two architectural modifications were introduced: a dynamic condenser pressure scaling mechanism proportionally linked to instantaneous liquid refrigerant mass, and an 8-stage spatially discretised counter-flow solution heat exchanger with finite thermal mass at each node. These modifications yield a robust, fully functional integrated model. Simulation results across three parametric scenarios demonstrate stable transient convergence, with a baseline COP of 0.718 (driving heat input is waste heat) establishing a computationally efficient tool for predicting absorption chiller behaviour under varying operational conditions.