Selvovervåket læring i NLP: Grunnlaget for trening av store språkmodeller

March 20, 2026
Comments 9
Teknologi og kunstig intelligens

Tenk deg en maskin som lærer å forstå språk uten noen å fortelle den hva som er riktig. Ingen svarkort. Ingen korrekte svar å memorere. Bare millioner av sider med tekst fra internett - og den må selv finne ut hva som gir mening. Dette er selvovervåket læring (self-supervised learning, SSL), og det er det som gjør at moderne språkmodeller som ChatGPT og LLaMA kan skrive, svare og tenke som mennesker.

Hva er selvovervåket læring?

Selvovervåket læring er ikke det samme som uovervåket læring, selv om mange blander dem sammen. I uovervåket læring søker modellen etter mønstre - kanskje gruppering av ord eller klustering av setninger. Men i selvovervåket læring er det en korrekt svar - bare at den ikke er gitt av en menneskelig annotator. Den er skjult i dataene selv.

Tenk på det slik: Du får en setning som: "Jeg drar til Oslo for å se på ". Din oppgave er å gjette hva som skal stå i stedet for . Svaret er ikke gitt av noen. Men det finnes - det var ordet som faktisk sto der i den opprinnelige teksten. Kanskje det var "festivalen". Eller "museet". Modellen må lage en forutsigelse, og så sammenligne med det faktiske ordet. Når den gjør det tusenvis av ganger, lærer den hvordan språk virkelig fungerer.

Dette er ikke tilfeldig. Det er en systematisk måte å trene modeller på ved å bruke den enorme mengden tekst som allerede finnes - uten å måtte betale folk for å merke hver setning. Og det har endret alt.

Hvordan fungerer det i praksis?

Det finnes to hovedmetoder som driver selvovervåket læring i NLP. Den ene er maskeordmodellering, som BERT bruker. Den andre er next token prediction, som GPT bruker. Begge er enkle i prinsipp, men kraftige i virkning.

BERT tar en tekst og skjuler noen ord med . Så spør den: "Hva var ordet her?" Modellen må gjette basert på konteksten. Hvis teksten er "Jeg spiser til frokost", og modellen svarer "kaffe", får den en god score. Hvis den svarer "bilkjøring", får den en dårlig score. Gjør du dette med millioner av setninger, lærer modellen ikke bare ord, men også grammatikk, betydning og sammenheng.

GPT gjør noe annet. Den tar en setning og spør: "Hva er det neste ordet?" Du gir den: "Jeg drar til Oslo for å se på", og den må gjette "festivalen". Den gjør det ord for ord, hele veien. Ingen masking. Ingen tilbakeblikk. Bare forutsetning basert på det som har kommet før. Denne metoden er spesielt godt egnet for å lage tekst - fordi den lærer å skrive, ikke bare å gjette.

Begge metodene bruker samme grunnprinsipp: dataen gir sine egne svar. Og det er nettopp det som gjør det så effektivt. Du trenger ikke et datasett med 100 millioner merkede setninger. Du trenger bare et datasett med 100 millioner setninger - uansett om de er merket eller ikke.

Hvorfor er dette så viktig for store språkmodeller?

Alle store språkmodeller - GPT-3, LLaMA, Claude, PaLM - starter med selvovervåket læring. Det er den første og viktigste fasen i treningen. Her lærer modellen grunnleggende språk. Hva ord betyr. Hva en setning bør se ut som. Hva som er rimelig og hva som er nonsens.

Etter det kommer to andre faser: overvåket læring og forsterkningslæring. I den andre fasen får modellen eksempler som: "Skriv en sammendrag av denne teksten" eller "Svar på dette spørsmålet på en venlig måte". Her lærer den å følge instruksjoner. I den tredje fasen får den tilbakemelding fra mennesker: "Det svaret var bra" eller "Det svaret var feil og farlig". Men uten den første fasen - selvovervåket læring - ville modellen ikke hatt noen grunn til å forstå hva en "forsøk" er. Den ville ikke ha kjent språket.

Det er som å lære et barn å snakke. Først hører det ord og setninger hele dagen. Så lærer det å bruke dem i riktig sammenheng. Så lærer det å svare på spørsmål. Men uten den første fasen - bare å høre - ville det aldri kunnet snakke.

To animefigurer — en med maske og en med penn — arbeider med å gjenopprette eller forutsi ord i en flytende setning.

Hvordan skiller det seg fra andre metoder?

La oss sammenligne:

Overvåket læring: Du gir modellen input og riktig svar. Eksempel: "Denne teksten er positiv" - og du forteller den at den er positiv. Den lærer å klassifisere. Men du trenger mye merker data - og det er dyrt og tidkrevende.
Uovervåket læring: Du gir modellen bare data. Den søker etter mønstre. Kanskje den grupperer ord som ofte kommer sammen. Den kan brukes til å redusere dimensjoner eller finne grupper. Men den lærer ikke å forutsi - bare å oppdage.
Selvovervåket læring: Du gir modellen data, og den lager sine egne "svar" fra dataene. Den lærer å forutsi. Og det er det som gjør den så kraftig. Den lærer språk på en måte som er nær det menneskelige læringssystemet.

Selvovervåket læring er den eneste metoden som kombinerer mengde med presisjon. Du kan bruke hele internett som trening - og likevel ha et klart, objektivt mål for hver forutsigelse.

Hva er fordelen med å bruke det sammen med overført læring?

En av de største styrkene ved selvovervåket læring er at den lager pre-trainede modeller. Når du har trent en modell på millioner av setninger, har den lært grunnleggende språk. Den er ikke flink på en spesifikk oppgave - som å klassifisere kundetilbakemeldinger - men den har en solid forståelse av språk.

Så tar du den modellen og trener den videre på et lite datasett med kundetilbakemeldinger. Bare 1000 eksempler. Og plutselig er den flink til å si om en tilbakemelding er positiv eller negativ. Det er overført læring. Og det er mulig fordi selvovervåket læring har laget en grunnleggende språkforståelse.

Uten selvovervåket læring, ville du måttet samle 10 000 merkede kundetilbakemeldinger for å trene en modell. Med selvovervåket læring trenger du bare 1000. Og resultatet er bedre.

Et barn blir omgitt av flyvende tekstbokstaver som lærer språk, mens en hjernelignende struktur lyser i bakgrunnen.

Hva er grensene?

Selvovervåket læring er ikke magisk. Den har problemer.

For det første: den lærer alt - også feil. Hvis treningsdataene inneholder fordommer, stereotyper eller feil fakta, så lærer modellen det også. GPT-3 har skrevet tekst som er sexistisk, racistisk eller feilaktig - ikke fordi den er ond, men fordi internett er det.

For det andre: selvovervåket læring alene gir ikke en nyttig modell. Den kan ikke svare på spørsmål. Den kan ikke følge instruksjoner. Den kan ikke skrive en e-post. Den kan bare gjette ord. Du må kombinere den med overvåket læring og forsterkningslæring for å få en modell som virkelig fungerer.

For det tredje: den trenger enorm mengder data og regnekraft. GPT-3 hadde 175 milliarder parametere. Det betyr at den måtte trene på tusenvis av GPU-er i måneder. Bare store selskaper kan gjøre det.

Hva er fremtiden?

Selvovervåket læring er ikke bare en teknikk. Den er en ny måte å tenke på læring. Den har gjort det mulig å bygge modeller som ikke bare kan gjette ord - men som kan skrive romaner, svare på vitenskapelige spørsmål, og skape kode.

Fremtiden vil ikke komme med en ny metode som erstatter selvovervåket læring. Den vil komme med bedre måter å bruke den. Bedre data. Bedre maskiner. Bedre måter å finne ut hva som er riktig i dataene. Og kanskje, en dag, modeller som kan lage sine egne oppgaver - og lærer av seg selv, uten mennesker.

Men i dag er det fortsatt selvovervåket læring som holder alt sammen. Det er den første, største, og mest viktige byggestenen i alle store språkmodeller. Og det er ikke bare teknologi. Det er en ny form for kunnskap - lærte av ordene selv.

Hva er forskjellen mellom selvovervåket læring og overvåket læring?

I overvåket læring får modellen forhåndsmerkede data - for eksempel en setning med et merke som "positiv" eller "negativ". I selvovervåket læring lager modellen sine egne "merker" fra dataene. For eksempel: den tar en setning, skjuler et ord, og prøver å gjette det. Svaret finnes i selve teksten - men det er ikke gitt av en person.

Hvorfor bruker GPT og BERT ulike metoder?

GPT bruker next token prediction fordi den er bygget for å generere tekst - den må kunne fortsette en setning. BERT bruker maskeordmodellering fordi den er bygget for å forstå kontekst - den må kunne gjette et savnet ord basert på det som kommer før og etter. Begge er selvovervåket, men de er designet for ulike oppgaver.

Kan selvovervåket læring brukes uten store data?

Nei. Selvovervåket læring fungerer bare når du har masse data - millioner eller milliarder av setninger. Med lite data vil modellen overfitte - den husker mønstre i små mengder, ikke generelle språkregler. Det er derfor bare store selskaper med tilgang til store datamengder kan trene de beste modellene.

Er selvovervåket læring det samme som deep learning?

Nei. Deep learning er en teknikk for å bygge modeller med mange lag - som nevronale nettverk. Selvovervåket læring er en måte å trene dem på. Du kan bruke deep learning med overvåket, uovervåket eller selvovervåket læring. De er forskjellige nivåer.

Hvorfor er selvovervåket læring så viktig for NLP?

Fordi språk er uendelig komplekst. Det finnes ikke nok merkede data for å dekke alle situasjoner. Selvovervåket læring lar oss bruke hele internett som trening - og lage modeller som forstår språk på en måte som ingen tidligere metode har klart. Den har gjort det mulig å bygge modeller som kan skrive, snakke og tenke - og det er grunnen til at AI nå virker som science fiction.

Post Comments (9)

Geir Isaksen

March 21, 2026 AT 01:43

lol sånn herregud da er vi tilbake til det samme som med deepfake - alt er bare 'data' og 'mønstre' og 'self-supervised'... men ingen tenker på at når du trener på hele internett, så lærer du å skrive som en 14-årig troll som tror 'literally' er en virkelig ord.

gpt-4 kan skrive en dikt om kaffekopp, men ikke skjønne at kaffen er kald. det er ikke intelligens. det er statistisk mimicry med et par billioner parametere.

Hayden Kjelleren

March 22, 2026 AT 13:34

jeg tenker på hvordan jeg selv lærte språk... ingen lærte meg grammatikk. bare hørte folk snakke. så prøvde jeg. feilet. prøvde igjen. og etter hvert... forstod jeg.

det er akkurat det. modellen er bare et barn som har lest 90% av internett. og det fungerer. forferdelig. men det fungerer.

Torolf Bjoerklund

March 23, 2026 AT 09:14

self-supervised learning? hah. det er bare 'copy-paste med farge' i ny drag.

du tror du har skapt intelligens, men du har bare bygget en super-thesaurus med en liten tilfeldig faktor.

:-P

Christoffer Sundby

March 25, 2026 AT 07:42

det er viktig å ikke bare se på teknikken, men på hva den *gjør*.

selvovervåket læring har gjort det mulig for små selskaper og studenter å bygge kraftige modeller uten millioner i budsjett.

ikke fordi det er perfekt, men fordi det er tilgjengelig. og det er en revolusjon.

vi må feire ikke bare hva modellene kan, men hvordan de har åpnet døren for mange.

Kristian Risteski

March 25, 2026 AT 14:06

fint å se at noen faktisk forstår at det ikke handler om 'merking' av data, men om å la språket snakke for seg selv.

ikke mange skjønner at når du tar en setning som 'jeg elsker kaffe og kake' og skjuler 'kake', så lærer modellen ikke bare at 'kake' er et ord - den lærer at kake og kaffe ofte er sammen, at de er mat, at de er triviale, at de er norske.

det er ikke statistikk. det er kulturell kontekst.

og det er det som gjør at den kan skrive en tekst om et bryllup i telemark og ikke bare liste opp ord som hører sammen.

det er som å lære et språk ved å lese bøker - ikke ved å memorere ordbøker.

Silje Løkstad

March 27, 2026 AT 12:17

SSL er ikke 'ny' - den er *fundamental*.

gjør deg ikke til skikkelig AI-entusiast uten å forstå at BERT og GPT er to sider av samme mynt: en modell som lærer å forutsi.

det er ikke deep learning. det er *predictive learning*.

og ja, det er en kollapse av syntaks, semantikk og pragmatikk i en enkelt loss-funksjon.

:-D

Elin Lim

March 28, 2026 AT 06:04

det er ikke intelligens. det er mønster.

modeller skriver ikke. de gjentar.

og det er farlig.

Kari Viitanen

March 29, 2026 AT 09:30

jeg vil bare understreke at selvovervåket læring ikke er en teknikk som er utviklet for å erstatte menneskelig intelligenstekst, men for å *utvide* vår evne til å kommunisere.

den gir oss et verktøy, ikke en erstatning.

og i en tid der språkbruk blir mer kompleks og multikulturell, er det viktig å huske at teknologien bør tjene mennesker - ikke omvendt.

Runa Kalypso

March 30, 2026 AT 08:40

jeg tror du har en typo i 'maskeordmodellering' - burde vel vært 'maskert ord' eller 'maskering av ord'?

men ellers - veldig bra forklaring!

det var det første gangen jeg faktisk skjønte hvorfor GPT og BERT er så ulike - det er ikke bare teknikk, det er filosofi.

en som lærer å skrive. en som lærer å forstå.

og det er akkurat det som gjør det så kult.

ps: jeg elsker kaffe og kake. :)