Forskningsprosjekt viser: Rettighetsbelagt innhold gir norske språkmodeller høy kvalitet
Språkmodeller som er trent på innhold der rettighetsbelagt norsk materiale inngår, oppnår bedre kvalitet. Dette viser den første rapporten fra forskningsprosjektet Mímir, hvor ledende norske forskningsmiljøer har trent en rekke nye språkmodeller og vurdert betydningen aviser og bøker under opphavsrett kan ha for denne typen kunstig intelligens. Prosjektet er initiert av regjeringen og ledes av Nasjonalbiblioteket.
– Dette prosjektet er unikt i verdenssammenheng, sier nasjonalbibliotekar Aslak Sira Myhre. – Mens det i USA og Europa blir opp til rettsvesenet å dømme i en kamp mellom rettighetshaverne og teknologiutviklerne, prøver vi i Norge å finne en felles vei for sikre både at den norske kunnskapen, språket og erfaringen reflekteres i språkmodeller, og at de som skaper innhold, blir kompensert for bruken.
Teknologien rundt og bruken av kunstig intelligens (KI) har hatt en rivende utvikling de siste årene. Behovet for en norsk nasjonal satsing på feltet er betydelig, og vi trenger tilgang til gode data for trening av KI. Dette er bakgrunnen for at regjeringen har gitt Nasjonalbiblioteket i oppgave å vurdere verdien av å bruke norsk innhold under opphavsrett for slike formål.
Samarbeid mellom forskningsmiljøene
Gjennom et halvt år har Nasjonalbiblioteket gjennomført prosjektet Mímir sammen med de sterkeste forskningsmiljøene på feltet i Norge: NorwAI ved NTNU i Trondheim og Language Technology Group ved Universitetet i Oslo. Takket være disse institusjonenes store stab av forskere og studenter har det vært mulig å gjennomføre trening og evaluering på rekordtid.
Gjennom Sigma2 har Mímir fått tilgang til nødvendig regnekraft på tungregnesentret LUMI i Finland. Dette samarbeidet har gjort det mulig å gjøre nybrottsarbeid på feltet, også sett i et internasjonalt perspektiv.
Store deler av den digitale samlingen i Nasjonalbiblioteket er lagt til rette som treningsdata for KI sammen med data fra andre kilder. Forskningsmiljøene har trent nærmere 20 ulike språkmodeller, og modellene er evaluert for å studere virkningen av ulike typer data.
Opphavsrett
Rettighetshaverne har hele veien vært informert om aktivitetene i prosjektet, og i siste del av Mímir har det vært nær kontakt mellom Nasjonalbiblioteket og rettighetshaverne.
Målet med prosjektet er å samle empiriske data som kan legge et grunnlag for eventuelle avtaler mellom staten og rettighetshavere om bruk av innhold under opphavsrett for KI-formål. Mímir er første del av et oppdrag Nasjonalbiblioteket har fått fra kultur- og likestillingsminister Lubna Jaffery og regjeringen. Det neste steget er å vurdere om det bør lages en kompensasjonsmodell og eventuelt et forslag til en slik modell.
Her finner du den tekniske rapporten fra Mímir-prosjektet.
Kontakter
Nina BræinPresseansvarligNasjonalbiblioteket
Tel:951 50 912presse@nb.noFølg pressemeldinger fra Nasjonalbiblioteket
Registrer deg med din e-postadresse under for å få de nyeste sakene fra Nasjonalbiblioteket på e-post fortløpende. Du kan melde deg av når som helst.
Siste pressemeldinger fra Nasjonalbiblioteket
Nordnorsk ungdomsopprør på 1980-tallet i nyrestaurert film fra Nasjonalbiblioteket4.11.2024 14:40:42 CET | Pressemelding
Morten Kolstads første spillefilm Piratene ble omfavnet av publikum, men rast mot fra konservativt hold, da den kom på kino i 1983. Nå har Nasjonalbiblioteket restaurert den actionfylte ungdomsfilmen og utgir den på Blu-ray.
Regjeringen vil satse stort på digitalisering og kunstig intelligens ved Nasjonalbiblioteket7.10.2024 14:00:00 CEST | Pressemelding
Nasjonalbibliotekets bevilgning økes med mer enn 50 millioner kroner i regjeringens forslag til statsbudsjett for 2025. Det meste av midlene skal brukes til å øke digitaliseringskapasiteten i Mo i Rana og i arbeidet med å trene generative språkmodeller.
Rekordmange lyttere og ny sesong for Gamle greier5.9.2024 13:15:00 CEST | Pressemelding
Med 20 000 trofaste lyttere i ryggen er Nasjonalbibliotekets historiepodkast Gamle greier fra 5. september klar for en ny sesong med dramatiske historiske hendelser fra middelalderen og fram til vår tid.
Denne uka åpner Credo «Nasjonalbibliotekbaren»2.9.2024 14:38:00 CEST | Pressemelding
Klokken 9 om morgenen torsdag 5. september åpner Credo og Heidi Bjerkan «Nasjonalbibliotekbaren» i andre etasje på Nasjonalbiblioteket på Solli plass i Oslo. I de historiske lokalene skal kafeen servere tradisjonsforankret mat laget fra bunnen av. Kafétilbudet vil også være viktig i arbeidet med formidling av matkultur, noe som er en vesentlig del av avtalen Credo har inngått med Nasjonalbiblioteket.
Internasjonal designpris til Nasjonalbibliotekets jubileumsutstilling for Landslova22.8.2024 13:32:00 CEST | Pressemelding
Nasjonalbibliotekets utstilling Med lova i hand. Magnus Lagabøtes landslov, 1274–2024 har vunne gull i kategorien «Better futures» ved London Design Awards 2024.
I vårt presserom finner du alle våre siste pressemeldinger, kontaktpersoner, bilder, dokumenter og annen relevant informasjon om oss.
Besøk vårt presserom