Forskningsprosjekt viser: Rettighetsbelagt innhold gir norske språkmodeller høy kvalitet

13.8.2024 11:24:00 CEST | Nasjonalbiblioteket | Pressemelding

Del

Språkmodeller som er trent på innhold der rettighetsbelagt norsk materiale inngår, oppnår bedre kvalitet. Dette viser den første rapporten fra forskningsprosjektet Mímir, hvor ledende norske forskningsmiljøer har trent en rekke nye språkmodeller og vurdert betydningen aviser og bøker under opphavsrett kan ha for denne typen kunstig intelligens. Prosjektet er initiert av regjeringen og ledes av Nasjonalbiblioteket.

– Dette prosjektet er unikt i verdenssammenheng, sier nasjonalbibliotekar Aslak Sira Myhre. – Mens det i USA og Europa blir opp til rettsvesenet å dømme i en kamp mellom rettighetshaverne og teknologiutviklerne, prøver vi i Norge å finne en felles vei for sikre både at den norske kunnskapen, språket og erfaringen reflekteres i språkmodeller, og at de som skaper innhold, blir kompensert for bruken.

Teknologien rundt og bruken av kunstig intelligens (KI) har hatt en rivende utvikling de siste årene. Behovet for en norsk nasjonal satsing på feltet er betydelig, og vi trenger tilgang til gode data for trening av KI. Dette er bakgrunnen for at regjeringen har gitt Nasjonalbiblioteket i oppgave å vurdere verdien av å bruke norsk innhold under opphavsrett for slike formål.

Samarbeid mellom forskningsmiljøene
Gjennom et halvt år har Nasjonalbiblioteket gjennomført prosjektet Mímir sammen med de sterkeste forskningsmiljøene på feltet i Norge: NorwAI ved NTNU i Trondheim og Language Technology Group ved Universitetet i Oslo. Takket være disse institusjonenes store stab av forskere og studenter har det vært mulig å gjennomføre trening og evaluering på rekordtid.

Gjennom Sigma2 har Mímir fått tilgang til nødvendig regnekraft på tungregnesentret LUMI i Finland. Dette samarbeidet har gjort det mulig å gjøre nybrottsarbeid på feltet, også sett i et internasjonalt perspektiv.

Store deler av den digitale samlingen i Nasjonalbiblioteket er lagt til rette som treningsdata for KI sammen med data fra andre kilder. Forskningsmiljøene har trent nærmere 20 ulike språkmodeller, og modellene er evaluert for å studere virkningen av ulike typer data.

Opphavsrett
Rettighetshaverne har hele veien vært informert om aktivitetene i prosjektet, og i siste del av Mímir har det vært nær kontakt mellom Nasjonalbiblioteket og rettighetshaverne.

Målet med prosjektet er å samle empiriske data som kan legge et grunnlag for eventuelle avtaler mellom staten og rettighetshavere om bruk av innhold under opphavsrett for KI-formål. Mímir er første del av et oppdrag Nasjonalbiblioteket har fått fra kultur- og likestillingsminister Lubna Jaffery og regjeringen. Det neste steget er å vurdere om det bør lages en kompensasjonsmodell og eventuelt et forslag til en slik modell.

Her finner du den tekniske rapporten fra Mímir-prosjektet.

Kontakter

Nina BræinPresseansvarligNasjonalbiblioteket

Tel:951 50 912presse@nb.no

Følg pressemeldinger fra Nasjonalbiblioteket

Registrer deg med din e-postadresse under for å få de nyeste sakene fra Nasjonalbiblioteket på e-post fortløpende. Du kan melde deg av når som helst.

Siste pressemeldinger fra Nasjonalbiblioteket

Fosseforedraget og Fosseprisen 2025: Feiring av skaparkraft og litteratur på Slottet og Nasjonalbiblioteket 24.–26. april3.4.2025 10:55:00 CEST | Pressemelding

Torsdag 24. april går det aller første Fosseforedraget av stabelen på Slottet. Den franske filosofen Jean-Luc Marion vil halde det nyskrivne foredraget Skaping, før kronprinsesse Mette-Marit deler ut den nyoppretta Fosseprisen for omsetjarar til tyske Hinrich Schmidt-Henkel.

Ny podkast fra Nasjonalbiblioteket om de norske borgerkrigene25.3.2025 09:38:36 CET | Pressemelding

I podkasten «Strid – de norske borgerkrigene» inviterer nasjonalbibliotekar Aslak Sira Myhre og historiker Ole-Albert Rønning Nordby deg med på en tidsreise tilbake til middelalderen. De snakker seg gjennom over hundre år med blodige slag, politiske intriger og maktkamper innad i den norske kongefamilien.

Hvordan kan bibliotekene styrke demokratiet?17.3.2025 10:00:00 CET | Presseinvitasjon

Bibliotekene er ikke bare steder for bøker – de er åpne rom for fellesskap, læring og demokratisk deltakelse. På Nasjonalbibliotekets vårkonferanse «Det tredje stedet» den 27. mars samles eksperter og fagfolk for å diskutere hvordan bibliotekene kan styrke demokratiet, skape møteplasser som motvirker ensomhet, spre kunnskap og forsvare ytringsfriheten.

To nye bygg styrker Nasjonalbiblioteket sitt arbeid med digitalisering av kulturarven i Mo i Rana25.2.2025 14:12:08 CET | Pressemelding

Det nye lydlaboratoriet og automatlageret til Nasjonalbiblioteket gir eit viktig løft til arbeidet med å sikre og gjere tilgjengeleg den norske kulturarven. No står dei to nye bygga klare, og 25. februar vart dei opna av kultur- og likestillingsminister Lubna Jaffery.

Bibliotek over hele landet feirer morsmålsdagen 21. februar17.2.2025 15:48:13 CET | Pressemelding

Den internasjonale morsmålsdagen blir markert verden over fredag 21. februar. I Norge benytter bibliotek over hele landet denne dagen til å synliggjøre de språklige ressursene i lokalmiljøet sitt.

I vårt presserom finner du alle våre siste pressemeldinger, kontaktpersoner, bilder, dokumenter og annen relevant informasjon om oss.

Besøk vårt presserom