Forskningsprosjekt viser: Rettighetsbelagt innhold gir norske språkmodeller høy kvalitet
Språkmodeller som er trent på innhold der rettighetsbelagt norsk materiale inngår, oppnår bedre kvalitet. Dette viser den første rapporten fra forskningsprosjektet Mímir, hvor ledende norske forskningsmiljøer har trent en rekke nye språkmodeller og vurdert betydningen aviser og bøker under opphavsrett kan ha for denne typen kunstig intelligens. Prosjektet er initiert av regjeringen og ledes av Nasjonalbiblioteket.
– Dette prosjektet er unikt i verdenssammenheng, sier nasjonalbibliotekar Aslak Sira Myhre. – Mens det i USA og Europa blir opp til rettsvesenet å dømme i en kamp mellom rettighetshaverne og teknologiutviklerne, prøver vi i Norge å finne en felles vei for sikre både at den norske kunnskapen, språket og erfaringen reflekteres i språkmodeller, og at de som skaper innhold, blir kompensert for bruken.
Teknologien rundt og bruken av kunstig intelligens (KI) har hatt en rivende utvikling de siste årene. Behovet for en norsk nasjonal satsing på feltet er betydelig, og vi trenger tilgang til gode data for trening av KI. Dette er bakgrunnen for at regjeringen har gitt Nasjonalbiblioteket i oppgave å vurdere verdien av å bruke norsk innhold under opphavsrett for slike formål.
Samarbeid mellom forskningsmiljøene
Gjennom et halvt år har Nasjonalbiblioteket gjennomført prosjektet Mímir sammen med de sterkeste forskningsmiljøene på feltet i Norge: NorwAI ved NTNU i Trondheim og Language Technology Group ved Universitetet i Oslo. Takket være disse institusjonenes store stab av forskere og studenter har det vært mulig å gjennomføre trening og evaluering på rekordtid.
Gjennom Sigma2 har Mímir fått tilgang til nødvendig regnekraft på tungregnesentret LUMI i Finland. Dette samarbeidet har gjort det mulig å gjøre nybrottsarbeid på feltet, også sett i et internasjonalt perspektiv.
Store deler av den digitale samlingen i Nasjonalbiblioteket er lagt til rette som treningsdata for KI sammen med data fra andre kilder. Forskningsmiljøene har trent nærmere 20 ulike språkmodeller, og modellene er evaluert for å studere virkningen av ulike typer data.
Opphavsrett
Rettighetshaverne har hele veien vært informert om aktivitetene i prosjektet, og i siste del av Mímir har det vært nær kontakt mellom Nasjonalbiblioteket og rettighetshaverne.
Målet med prosjektet er å samle empiriske data som kan legge et grunnlag for eventuelle avtaler mellom staten og rettighetshavere om bruk av innhold under opphavsrett for KI-formål. Mímir er første del av et oppdrag Nasjonalbiblioteket har fått fra kultur- og likestillingsminister Lubna Jaffery og regjeringen. Det neste steget er å vurdere om det bør lages en kompensasjonsmodell og eventuelt et forslag til en slik modell.
Her finner du den tekniske rapporten fra Mímir-prosjektet.
Kontakter
Nina BræinPresseansvarligNasjonalbiblioteket
Tel:951 50 912presse@nb.noFølg pressemeldinger fra Nasjonalbiblioteket
Registrer deg med din e-postadresse under for å få de nyeste sakene fra Nasjonalbiblioteket på e-post fortløpende. Du kan melde deg av når som helst.
Siste pressemeldinger fra Nasjonalbiblioteket
Sigrun Aker Nordeng skal lede feiringen av Henrik Ibsens 200-årsjubileum9.1.2025 10:00:43 CET | Pressemelding
Nasjonalbiblioteket har ansatt Sigrun Aker Nordeng som leder for Ibsen 2028, markeringen av 200-årsjubileet for Henrik Ibsens fødsel. Nordeng kommer fra stillingen som leder for strategi og utvikling ved Munchmuseet.
200-årsjubileum for punktskriften: Nyttårskonsert på Nasjonalbiblioteket med pianist Ulf Nilsen30.12.2024 09:44:13 CET | Pressemelding
Start året med en stemningsfull konsertopplevelse i Nasjonalbibliotekets Store Auditorium. Lørdag 4. januar kl. 14 byr pianist Ulf Nilsen på et variert program med musikk av Edvard Grieg, Johann Sebastian Bach og Fartein Valen. Han deler også historier fra sin musikalske reise, fra han som barn fikk pianotimer og lærte seg punktnoter.
Nasjonalbiblioteket inngår unik intensjonsavtale med Vatikanet4.12.2024 11:00:00 CET | Pressemelding
Nasjonalbiblioteket har inngått en intensjonsavtale med Vatikanets apostoliske bibliotek og Vatikanets apostoliske arkiv om å digitalisere, transkribere og oversette alle kilder til norsk historie som finnes i disse institusjonene. Målet er å gjøre dokumentene tilgjengelige for offentligheten fram mot jubileet for slaget på Stiklestad i 2030. Avtalen er et resultat av et unikt samarbeid hvor Vatikanet ønsker å åpne sine arkiver, og det norske prosjektet er en av pilotene.
VG-teiknar Roar Hagen donerer teikningane sine til Nasjonalbiblioteket16.11.2024 09:00:00 CET | Pressemelding
Med sin karakteristiske strek har Roar Hagen tolka det norske nyheitsbildet i VGs kommentarspalter gjennom 38 år. No donerer han teikningane sine til Nasjonalbiblioteket.
Utvalgte bilder fra Peter Wessel Zapffes arkiv i ny fotobok14.11.2024 13:40:07 CET | Pressemelding
Den norske filosofen Peter Wessel Zapffe (1899−1990) tok bilder gjennom nesten hele sitt lange liv, og arkivet etter ham rommer flere tusen fotografier. I Nasjonalbibliotekets nye bokutgivelse Peter Wessel Zapffe. Åpninger i landskapet får du et innblikk i Zapffes utforskende fotokunst.
I vårt presserom finner du alle våre siste pressemeldinger, kontaktpersoner, bilder, dokumenter og annen relevant informasjon om oss.
Besøk vårt presserom