Programvareutvikling og prosjektledelse
Nasjonalbiblioteket transkribering.jpg

Nasjonalbiblioteket

Norsk tale til tekst hos Nasjonalbiblioteket

Nasjonalbiblioteket ønsker å gjøre det lettere for firmaer å utvikle norske talegjenkjenningsverktøy. Da trenger man store datasett med transkribert tale. Schjønhaug AS utviklet derfor et transkriberingsverktøy skreddersydd for Nasjonalbibliotekets behov.

Tekst: Writbeat

Nasjonalbiblioteket transkribering.jpg

Schjønhaug AS har i flere år arbeidet med transkriberingsverktøyet Benevis som omformer lydfiler til tekst. Dette har blant annet blitt tatt i bruk av NRK, og har gjort arbeidet enklere for mange journalister som daglig må transkribere intervjuer og lydfiler.

– Jeg holdt et foredrag om automatisk transkribering av norsk tale til tekst på universitetet i Oslo, og blant publikum satt det en leder fra Nasjonalibiblioteket som fattet interesse i arbeidet vårt, sier Andreas Schjønhaug, daglig leder i Schjønhaug AS.

Et språkpolitisk oppdrag

Nasjonalbiblioteket har startet et talegjenkjenningsprosjekt på eget initiativ hvor de ønsker å lage store arkiver med transkribert tale. Tanken er at man skal bidra til å skape gode norske talegjenkjenningsverktøy ved å lage ressurser som kan brukes av firmaer som velger å videreutvikle slik teknologi.

– Norsk er et lite språk og slike datasett med transkribert tale er dyre å utvikle. Dermed er det fare for at firmaer ikke tar seg råd til å utvikle gode talegjenkjenningsverktøy for det norske markedet. For å bidra til at firmaer satser på det norske språk, har vi valgt å lage disse datasettene selv og gjøre dem fritt tilgjengelige i Språkbanken, sier Per Erik Solberg, språkteknolog ved Nasjonalbiblioteket.

Ved tidligere prosjekter måtte de ansatte ved Nasjonalbiblioteket transkribere alle lydfiler for hånd. Men ved hjelp av verktøyet utviklet av Schjønhaug AS får de en ferdig transkripsjon, og språkteknologene må kun språkvaske teksten og rette opp i feil.

– En automatisk transkripsjon er ikke perfekt, men oppgaven vår blir i hovedsak språkvask. Dette betyr at vi sparer svært mye tid på manuelt arbeid, sier Solberg.

En komplisert oppgave

Verktøyet fungerer ved at lydfiler blir kjørt gjennom et talegjenkjenningsprogram fra Google og gir Nasjonalbiblioteket et tekstbehandlingsverktøy hvor de kan redigere og rette opp feil i teksten.

Vi oppga våre behov til Schjønhaug og har fått et verktøy skreddersydd til vårt oppdrag. Vi trengte et brukervennlig verktøy som gjorde det enkelt å redigere teksten etter lydfilen er blitt automatisk transkribert.
— Per-Erik Solberg

Løsningen til Schjønhaug AS er komplisert fordi den plukker opp naturlig lyd fra en vanlig setting. Verktøyet må dermed tolke mange ulike stemmer, dialekter og stemmevolum.

– Dette er en komplisert oppgave siden vi har lydfiler fra diskusjoner, vanlig tale og foredrag. Den må dermed tilpasse seg ulike tempo og tale, forteller Solberg.

Foto av Elisa Guarneros

Fritt tilgjengelig

Dette prosjektet sikter hovedsakelig på å styrke det norske språk og sikre at firmaer kan utvikle gode språkverktøy på norsk. Dermed har både Schjønhaug AS og Nasjonalbiblioteket gjort det enkelt for andre å ta i bruk ressursene fra dette oppdraget.

– Våre datasett med transkribert tale og Schjønhaug AS sitt verktøy vil ligge fritt tilgjengelig i Språkbanken slik at disse ressursene kan brukes av alle, forteller Solberg.

I et så stort og omfattende prosjekt som dette er det viktig at kommunikasjonen mellom interessentene fungerer godt. Solberg sier at Schjønhaug AS har vært lett å samarbeide med og at verktøyet har blitt endret og forbedret i takt med deres tilbakemeldinger.

– Andreas Schjønhaug er svært omgjengelig og teamet hans var raske til å respondere om vi trengte hjelp eller endringer i verktøyet, avslutter Solberg.