ɫɫÀ²

Tapahtumat

Väitös robotiikan ja autonomisten systeemien alalta, M.Sc. Wenshuai Zhao

Tämä väitöskirja tutkii menetelmiä, joilla robotteja ja autonomisia agentteja voidaan kouluttaa datan avulla.
Väitös Aalto-yliopiston sähkötekniikan korkeakoulusta, sähkötekniikan ja automaation laitokselta
Kuvitus puhujakorokkeesta ja sen yläpuolella olevasta tohtorinhatusta.

Väitöskirjan nimi: Robot learning across agents: from imitation to multi-agent cooperation

³Õä¾±³Ù³Ù±ð±ô¾±Âáä: Wenshuai Zhao
³Õ²¹²õ³Ù²¹±¹Ã¤¾±³Ù³ÙäÂáä:&²Ô²ú²õ±è;Prof. Ville Hautamäki, Itä-Suomen yliopisto
Kustos: Prof. Joni Pajarinen, Aalto-yliopiston sähkötekniikan korkeakoulu

Kun robotit siirtyvät osaksi arjen ympäristöjä, niiden on opittava sekä yksittäisiä taitoja että koordinoitua yhteistyötä. Tämä väitöskirja kehittää uusia oppimismenetelmiä, jotka auttavat robotteja omaksumaan monimutkaisia käyttäytymismalleja itsenäisesti ja toimimaan tehokkaasti ryhmissä.

Väitöskirja käsittelee ensin keskeistä haastetta ihmisen liikedatan hyödyntämisessä humanoidirobottien opettamisessa: ihmisten liikkeet rikkovat usein robotin fyysisiä rajoituksia. Väitöskirja esittelee uuden imitointioppimisen viitekehyksen, joka mukauttaa samanaikaisesti robotin tavoiteliikettä ja ohjauspolitiikkaa, mahdollistaen haastavien taitojen – kuten hyppäämisen ja potkaisemisen – oppimisen fyysisesti johdonmukaisella tavalla.

Tutkimus keskittyy seuraavaksi moniagenttiyhteistyöhön. Väitöskirja ehdottaa useita uusia algoritmeja ratkaisemaan moniagenttivahvistusoppimisen tyypillisiä ongelmia: alisuoriintuvien yhteisten päätösten välttämistä, oppimisen tehokkuuden parantamista ja rajallisiin havaintoihin liittyvien haasteiden lieventämistä. Lisäksi esitellään uusi opetussuunnitelmaan perustuva strategia, joka auttaa robotteja oppimaan tehokkaammin tilanteissa, joissa palkkiot ovat harvinaisia.

Lopuksi väitöskirja yhdistää yksiagenttisen ja moniagenttisen oppimisen analysoimalla, miten rajoitetut havainnot vaikuttavat suorituskykyyn, ja osoittamalla, että osittainen informaatio voi toisinaan lisätä oppimisen robustisuutta.

Nämä tulokset tarjoavat sekä uusia algoritmeja että teoreettisia oivalluksia autonomisten järjestelmien kehittämiseen – järjestelmien, jotka kykenevät oppimaan monimutkaisia taitoja ja työskentelemään luotettavasti yhdessä. Ne voivat kiinnostaa robotiikan tutkijoiden lisäksi myös autonomisen ajamisen ja moniagenttijärjestelmien parissa työskenteleviä.

Avainsanat: vahvistusoppiminen, imitointioppiminen, moniagenttioppiminen

Linkki väitöskirjan sähköiseen esittelykappaleeseen (esillä 7 päivää ennen väitöstä):  

Yhteystiedot: wenshuai.zhao@aalto.fi 

Sähkötekniikan korkeakoulun väitöskirjat

Suuri valkoinen 'A!' veistos Otaniemen Kandidaattikeskuksen katolla. Taustalla puu ja muita rakennuksia.

Sähkötekniikan korkeakoulun väitöskirjat ovat saatavilla yliopiston ylläpitämässä avoimessa Aaltodoc-julkaisuarkistossa.

Zoom pikaopas
  • ±Êä¾±±¹¾±³Ù±ð³Ù³Ù²â:
  • Julkaistu:
Jaa
URL kopioitu