ɫɫ

Uutiset

Tutkijat opettavat tekoälyn kuvailemaan videoita – EU-hankkeessa kehitettävä menetelmä voi mullistaa suurten videokokoelmien käsittelyn

Uusi menetelmä yhdistää tekstikuvailuun sekä videolla kuuluvan puheen että kuvan sisällön ja tuottaa tekstin suoraan halutulle kielelle.

Kuvailutulkki poimii videosta tärkeitä yksityiskohtia. Kuvakaappauksessa näkyy myös tyypillisiä nykyaikaisia konekäännösvirheitä. Kuvakaappaus videolta https://www.youtube.com/watch?v=bShnHADOS2Y

Tammikuussa 2018 alkaneessa EU:n rahoittamassa projektissa kehitetään Aalto-yliopiston uusimpiin kuvan- ja äänenkäsittelyn tutkimustuloksiin perustuva menetelmä audiovisuaalisen aineiston kuvailuun ja luokitteluun. Projektin yhtenä opetusaineistona käytetään Yleltä saatuja videomuotoisia arkistomateriaaleja.

”Menetelmän avulla saadaan automaattisesti tekstikuvaus videon tapahtumista ja puheesta. Vertailemalla menetelmän tuottamaa kuvausta ihmisten tuottamiin kuvauksiin tekoälyjärjestelmä voidaan opettaa parantamaan tuloksiaan”, kertoo projektia koordinoiva Aalto-yliopiston signaalikäsittelyn ja akustiikan laitoksen professori Mikko Kurimo.

Automaattista kuvailua on tehty aikaisemmin valokuvista, mutta videon sisällön kuvailu on suhteellisen uusi asia. Uutta menetelmässä on se, että se pystyy yhdistämään sekä puheen että kuvan sisältöä kuvailua tehdessään. Lisäksi menetelmä tuottaa tekstin suoraan halutulle kielelle, jolloin vältetään käännösvirheet.

Audiovisuaalisen sisällön automaattinen kuvaaminen tekstinä mullistaa suurten videokokoelmien käsittelyn esimerkiksi mediayhtiöissä ja mahdollistaa aiemmin tuotetun materiaalin kierrättämisen ja soveltamisen uusiin tarkoituksiin. Lisäksi tekstikuvailu ja siihen perustuva haku helpottavat aineiston löydettävyyttä ja saavutettavuutta sekä suurelle yleisölle että erityisesti heikkokuuloisille ja -näköisille.

”Tekoälyn mahdollistama uudenlainen löydettävyys, saavutettavuus ja henkilökohtainen palvelukokemus ovat jatkossa elintärkeitä menestystekijöitä eurooppalaiselle media-alalle. Sisällön ymmärtäminen on yksi lupaavimmista tekoälyn alueista tällä hetkellä”, sanoo Ylen innovaatiostrategiasta vastaava päällikkö Anssi Komulainen.

EU:n H2020 rahoittaman ”Methods for Managing Audiovisual Data" -projektin kesto on kolme vuotta ja varsinaiset partnerit ovat Aalto-yliopisto, Helsingin yliopisto, Yle, Lingsoft, Limecraft, University of Surrey, EURECOM ja INA. Aalto-yliopistosta signaalinkäsittelyn ja akustiikan laitoksen lisäksi mukana on tietotekniikan laitos. Ylessä MeMAD-yhteistyö on osa Yle Beta -projektia, jonka tavoitteena on rakentaa seuraavan sukupolven mediakokemusta.

۳ٱ԰쾱ö

Mikko Kurimo, professori, Aalto-yliopisto, signaalinkäsittelyn ja akustiikan laitos
p. 050 347 6221
mikko.kurimo@aalto.fi

Anssi Komulainen, päällikkö, innovaatiostrategia, Yle Beta
p. 0400 129 524
anssi.komulainen@yle.fi

  • äٱٳٲ:
  • Julkaistu:
Jaa
URL kopioitu

Lue lisää uutisia

Two students and a professor sitting around a table, talking and looking at laptop screen.
Tutkimus ja taide, Opinnot Julkaistu:

Tule uusien tohtoriopiskelijoiden tutoriksi syyskuussa 2025

lmoittaudu uusien tohtoriopiskelijoiden tutoriksi orientaatiopäiville!
Henkilö lukee kirjaa ison valaistun 'A'-kyltin edessä.
Mediatiedotteet Julkaistu:

Yli puolet korkeakoulutetuista maahanmuuttajista työllistyy Espoon ja Aalto-yliopiston kehittämällä palvelulla

۳ٱ𾱲ٲöllä on saatu aikaan erinomaisia tuloksia korkeakoulutettujen maahanmuuttajien työllistymisessä.
Vasemmassa kuvassa immuniteetti on paikallinen, kun oikeassa kuvassa se on satunnainen. Kuva: Jari Saramäen tutkimusryhmä, Aalto-yliopisto.
Tutkimus ja taide Julkaistu:

Tuore tutkimus osoittaa: Pandemioissa laumaimmuniteetti ei jakaudu tasaisesti

Pandemioiden torjunnassa ihmisten välisten sosiaalisten verkostojen ymmärtäminen on yhtä tärkeää kuin tietää, kuinka moni on immuuni.
Metsä, jossa vihreä sammalpeitto ja ohuita puita, neliönmuotoinen mittakehä sammalen päällä.
Mediatiedotteet Julkaistu:

Satelliittikuvat paljastavat ennallistamisen vaikutukset turvemailla

Yli 20 vuotta kattava satelliittiaineisto osoittaa, että ennallistettujen turvemaiden lämpötila ja heijastavuus alkavat muistuttaa luonnontilaisia soita noin vuosikymmenessä.