Venäjän tiedeakatemian Pietarin tutkimuskeskus on laatinut ohjelman, joka tunnistaa äänimateriaalista livvinkarjalan murteen ja muuttaa puhetta tekstiksi. Nyt ohjelma on kaikkien saatavilla. Puheentunnistusohjelma on laadittu yhteistyössä Karjalan tutkimuskeskuksen kanssa. Karjalaa hankkeessa edustivat matemaatikko Andrei Križanovski, Kielen, kirjallisuuden ja historian instituutin johtaja Irina Novak ja instituutin tutkija Aleksandra Rodionova.
Ohjelmassa käytettiin sekä puhenäytteitä että tekstejä. Rodionova keräsi sopivan aineiston tunnistusohjelmaa varten.
— Tekstejä tarjosivat Verso- ja Periodika-kustantamot. Ensisijaisesti ohjelmassa käytettiin Oma Mua -lehdessä vuosina 2000—2022 julkaistuja tekstejä. Lisäksi käytettiin materiaaleja instituuttimme kehittämästä VepKar-korpuksesta. Tunnistusohjelman korpuksessa on yli viisi miljoonaa sanamuotoa, tutkija kertoo.
Puhenäytteitä tutkijat saivat Karjalan televisio- ja radioyhtiön kansalliskieliseltä toimitukselta.
— Puhenäytteitä otimme Kodirandaine-radio-ohjelmasta. Hankkeessa käytettiin kymmenen ohjelman äänitteitä. Korpuksessa on kuuden miehen ja yhdeksän naisen puhenäytteitä, Rodionova sanoo.
Rodionovan mukaan ohjelma nopeuttaa tutkijoiden työtä.
Puheentunnistimen laatijat toivovat, että karjalan kielen parissa työskentelevien tutkijoiden lisäksi ohjelma tuo hyötyä myös karjalankielisen Oma Mua -lehden toimittajille.
— Äänitteiden purku on tärkeä osa toimittajan työtä ja joskus se vaatii paljon aikaa. Aiomme käyttää uutta ohjelmaa työssämme. Olen varma, että se nopeuttaa toimittajiemme työtä, Oma Mua -lehden päätoimittaja Natalja Sinitskaja kommentoi.
Liity Oma Median Telegram-kanavalle!