Kohti parempaa puheentunnistusta: Lahjoita puhetta -kampanja palkittiin parhaana mobiilipalveluna
Parempaan suomenkieliseen puheentunnistukseen tähtäävä Lahjoita puhetta -kampanja sai Grand One -mediapalkinnon kategoriassa Paras mobiilipalvelu. on Suomen suurin digitaalisen median kilpailu, ja voittajat julkaistiin virtuaaligaalassa 29.4.2021. Kampanja sai myös kunniamaininnan kategoriassa Paras datan käyttö.
Lahjoita puhetta -kampanjan tarkoituksena on saada kerättyä mahdollisimman paljon erilaista puhuttua suomea. Kerätyn puheen avulla kehitetään puheentunnistusta ja tekoälyä ymmärtämään paremmin suomenkielistä puhetta. Yleishyödyllisessä hankkeessa ovat mukana esimerkiksi YLE, Helsingin yliopisto, Valtion kehitysyhtiö Vake (nyk. Ilmastorahasto) sekä Aalto-yliopisto. Puhetta voi lahjoittaa tietokoneen selaimella tai puhelinsovelluksella. Tutustu kampanjaan tarkemmin .
Aalto-yliopiston puheentunnistuksen tutkimusryhmää johtava professori Mikko Kurimo kertoo puhuneensa aiheen tärkeydestä eri tilaisuuksissa jo kymmenien vuosien ajan. Kurimolla on ollut kampanjan toteutumisessa tärkeä rooli. Hän on muun muassa ohjannut sitä, millaista dataa kannattaa kerätä, kuinka paljon sitä tarvitaan ja keneltä sitä kannattaa kerätä. Puhuttua suomea on nyt kerätty lähes 4000 tuntia, joten seuraavaksi Kurimon tutkimusryhmä kehittää automaattisia menetelmiä datan tarkastukseen, korjailuun ja annotointiin eli aineiston kuvaamiseen ja luokitteluun.
Muut kielet laahaavat englannin perässä
Miksi suomenkielistä puheentunnistusta on sitten tarpeen kehittää? Puheentunnista hyödynnetään yhä enemmän erilaisissa tärkeissä sovelluksissa, kuten puheohjauksessa, puhehaussa, sanelussa, puheen litteroinnissa, tekstityksessä, tulkkauksessa ja tiedonhauissa. Kurimon mukaan suomenkielisen puheentunnistuksen ongelmista kärsivät ensisijaiset suomalaiset itse ja olisi kurjaa, jos näiden palveluiden käyttö edellyttäisi jatkossakin sujuvaa englannin kielen taitoa.
”Sama tilanne on myös valtaosalla maailman yli 6000 kielestä. Suomella onkin nyt tämän kattavuudeltaan ja avoimuudeltaan ainutlaatuisen datan ansioista mahdollisuus toimia pienten kielten tietoteknisten sovellusten kehityksen pioneerina”, Kurimo kertoo.
Puheen ja kielen tutkimus on itsessäänkin tärkeää, koska se paljastaa tärkeitä asioita ihmisen kommunikoinnista ja käyttäytymisestä – ja suurien aineistojen tutkiminen vaatii myös automaattisten työkalujen kehittämistä.
Lahjoita puhetta -kampanjasta kerätty puhe pitää tutkijat kiireisenä, mutta tutkimusryhmä työskentelee muidenkin mielenkiintoisten projektien parissa. Ryhmä teki vastikään eduskunnan julkisista istuntotallenteista 2008 – 2020 suuren puheaineiston. Lisäksi ryhmässä tutkitaan suullisen kielitaidon tietokoneavusteista mittausta ja harjoittelua, televisio-ohjelmien ja elokuvien tekstitystä sekä haastavien käyttäjäryhmien, kuten lasten ja kielenoppijoiden, puheentunnistusta.
Haluatko osallistua puhetalkoisiin ja parantaa suomenkielistä puheentunnistusta? Kampanja on edelleen käynnissä – lahjoita puhetta osoitteessa !
Lue lisää uutisia
Äänesi paljastaa enemmän kuin uskot – tutkijat kehittävät keinoja suojata puheeseen kätkeytyvää tietoa
Puheteknologiat yleistyvät vauhdilla, ja samalla kasvaa riski siitä, että ääni paljastaa arkaluonteista tietoa terveydestä, taustoista tai mielipiteistä. Aalto-yliopiston tutkijat kehittävät keinoja mitata ja rajoittaa sitä, mitä kaikkea puheesta voidaan päätellä.
Aallon vuosi 2025: Kvanttihyppyjä, luovia loikkia ja ratkaisuja parempaan elämään
Kasvua, teknologiaa ja teollisuuden uudistumista, ihmislähtöisiä ratkaisuja, terveys ja arjen hyvinvointi sekä hauskaa arkea ja toimivia yhteisöjä.
Merkittävä EU-rahoitus kahdelle Unite! Seed Fund -hankkeelle, joissa Aalto on mukana
Kaksi arvostettua EU-rahoitusta on myönnetty hankkeille, joita on alun perin tuettu Unite! Seed Fund -rahoituksella. Aalto-yliopisto on mukana molemmissa hankkeissa.