Aallon tutkijat voittivat kansainvälisen puheentunnistuksen kilpailun
Professori Mikko Kurimon johtama puheentunnistuksen tutkimusryhmä on voittanut kansainvälisen Multi-Genre Broadcast (MGB) Challenge -kilpailun, jossa tehtävänä oli rakentaa puheentunnistin YouTubesta kerätylle egyptinkielelle.
”Egyptin puhekielinen sanasto poikkeaa merkittävästi standardiarabiasta eikä suuria egyptiläisiä puheaineistoja ole saatavilla. Tutkimusryhmällä ei ollut aiempaa kokemusta arabiansukuisten kielen puheentunnistuksesta eikä yhtään arabiankielen taitajaa, mutta tästä huolimatta Aallon tunnistin oppi tunnistamaan sekä arabian- että egyptinkielistä puhetta tekstiksi selvästi tarkemmin kuin kukaan muu kilpailija”, kertoo professori Mikko Kurimo.
Aallon tunnistin hyödyntää uusimpia menetelmiä puheen ja kielen mallintamiseen syvien neuroverkkojen avulla. Erityisesti Aallon tutkimusryhmässä pitkään kehitellyt työkalut kielen mallintamiseen sanan osien avulla vaikuttivat merkittävästi tunnistimen suorituskykyyn. Nämä työkalut mallintavat tehokkaasti morfologisesti rikkaissa kielissä kuten suomessa ja virossa esiintyvät lukuisat eri sanamuodot ja niiden esiintymisen puheessa.
Video esittelee puheentunnistuksen ryhmän tutkimusta.
”Aalto voitti luultavasti siksi, että vain Aallon järjestelmä osasi tehokkaasti käyttää kielimalleissaan sanoja lyhyempiä yksiköitä eikä järjestelmä rajoittunut ennalta valittuun sanastoon.”
Aallon jälkeen seuraaville sijoille sijoittuvat tutkimusryhmät Tsinghua-yliopistosta Kiinasta ja Johns Hopkins- ja MIT-yliopistoista Yhdysvalloista. Aallossa kehitetty tunnistin on kuvattu artikkelissa, joka esitetään 2017 IEEE Automatic Speech Recognition and Understanding workshopissa joulukuussa Japanin Okinawassa. Artikkelin käsikirjoitus on jo nähtävillä allaolevasta linkistä.
äپٴDz:
Tohtorikoulutettava Peter Smit
peter.smit@aalto.fi
Professori Mikko Kurimo
mikko.kurimo@aalto.fi
Lue lisää uutisia
Äänesi paljastaa enemmän kuin uskot – tutkijat kehittävät keinoja suojata puheeseen kätkeytyvää tietoa
Puheteknologiat yleistyvät vauhdilla, ja samalla kasvaa riski siitä, että ääni paljastaa arkaluonteista tietoa terveydestä, taustoista tai mielipiteistä. Aalto-yliopiston tutkijat kehittävät keinoja mitata ja rajoittaa sitä, mitä kaikkea puheesta voidaan päätellä.
Aallon vuosi 2025: Kvanttihyppyjä, luovia loikkia ja ratkaisuja parempaan elämään
Kasvua, teknologiaa ja teollisuuden uudistumista, ihmislähtöisiä ratkaisuja, terveys ja arjen hyvinvointi sekä hauskaa arkea ja toimivia yhteisöjä.
Merkittävä EU-rahoitus kahdelle Unite! Seed Fund -hankkeelle, joissa Aalto on mukana
Kaksi arvostettua EU-rahoitusta on myönnetty hankkeille, joita on alun perin tuettu Unite! Seed Fund -rahoituksella. Aalto-yliopisto on mukana molemmissa hankkeissa.