Vitenskapelig oppdaging med tenkningstyrkede store språkmodeller

March 1, 2026
Comments 9
Teknologi og kunstig intelligens

Den gamle ideen om at datamaskiner bare kan hjelpe forskere med å søke gjennom litteratur eller regne ut tall har forlengst blitt overgått. I 2026 er store språkmodeller (LLM) ikke lenger bare verktøy - de er medforskere. Og det er ikke bare fordi de kan skrive bra tekster. Det er fordi de nå kan tenke.

Hva betyr "tenkningstyrket" i praksis?

Tenkningstyrkede store språkmodeller skiller seg fra vanlige modeller på en viktig måte: de kan følge en logisk kjede av resonnement. I stedet for bare å svare "det er en høyere energi i denne molekylstrukturen", sier de: "Molekylet har en syregruppe som kan frigi protoner, noe som reduserer stabiliteten. Samtidig har den lange karbonkjeden en høy elektronforskyvning, som øker reaktiviteten. Det betyr at denne forbindelsen vil reagere raskere enn en tilsvarende uten syregruppe. Jeg foreslår å teste dette ved å måle reaksjonshastigheten under pH 3 og pH 7." Dette er ikke bare bedre svar. Det er vitenskapelig tenkning. Og det er nettopp det som gjør at disse modellene kan bidra til oppdagelser, ikke bare til forklaringer.

Hvordan lærer modeller å tenke som en forsker?

Det er ikke nok å trenes på bøker og vitenskapelige artikler. Man må lære dem hvordan forskere tenker. To metoder har vist seg spesielt effektive:

Supervisert finetuning med resonnerings-trajectoryer: Forskere har generert 16.000 eksempler på hvordan en ekspert tenker gjennom et kjemisk problem - fra observasjon, over hypotese, til eksperimentell design og resultatfortolkning. Disse eksemplene brukes til å trenes modellen til å følge samme steg-for-steg-prosess.
Forsterkningslæring basert på kjemiske prinsipper (RLPGR): I stedet for å belønne modellen bare for riktig svar, belønnes den for å bruke riktige kjemiske lover. Hvis den for eksempel glemmer at en molekylstruktur må oppfylle oktettregelen, får den en negativ belønning. Det gjør at modellen lærer å tenke logisk, ikke bare å gjette.

En modell som heter MPPReasoner, bygget på Qwen2.5-VL-7B-Instruct, bruker begge disse metodene. Den kombinerer bilde av molekyler med deres tekstlige beskrivelse (SMILES-strenger) og klarer å forutsi egenskaper som løselighet og reaktivitet med 7,91 % bedre presisjon enn tidligere beste modeller - og 4,53 % bedre på nye, ukjente molekyler.

De tre nivåene av AI som forsker

Det er ikke bare en grad av forbedring. Det er tre helt forskjellige roller AI kan spille i vitenskapelig forskning:

AI som verktøy: Den utfører enkelt oppgaver - f.eks. å finne alle artikler om en spesifikk kjemisk forbindelse. Den trenger direkte instruksjoner fra mennesker.
AI som analytiker: Den ser på kompleks data, trekker sammen mønstre, og foreslår hypoteser. Eksempel: "Av de 120 nye batterimaterialene du testet, er tre av dem som har høy konduktivitet og lav volumutvidelse. De har alle en felles strukturell egenskap: en hexagonal gitterstruktur. Jeg foreslår å teste om dette er en generell regel."
AI som forsker: Den starter prosjekter selv. Den leser litteratur, lager hypoteser, planlegger eksperimenter, kjører simuleringer, analyserer resultatene, og foreslår neste skritt. Den kan gjøre dette i uker uten menneskelig innblanding. SES AI’s "Molecular Universe"-modell med 70 milliarder parametre er en av de første som opererer på dette nivået.

Det er bare på det tredje nivået at AI virkelig begynner å oppdage noe nytt. Ikke bare å finne det som allerede er skrevet, men å se noe som ingen har tenkt på.

En forsker og en AI med flytende atomer ser på en matematisk ligning som vises i luften, i anime-stil.

Hvordan AI oppdager lover i naturen

En av de mest fascinerende anvendelsene er innen symbolic regression - det vil si å finne matematiske ligninger som beskriver naturlover. I stedet for å bruke en algoritme som bare prøver alle mulige ligninger, bruker modeller som LLM-SR og DrSR sin forståelse av fysikk og kjemi for å begrense søket.

En modell som tidligere bare kunne si "denne ligningen passer godt med dataene" kan nå si: "Dataene viser en ikke-lineær respons ved høy temperatur. En polynomisk modell vil overfitte. En signumfunksjon vil forklare skiftet i oppførsel. Jeg foreslår å teste ligningen: y = a·sign(x - b) + c." Det er ikke bare raskere. Det er mer korrekt. I fysikktester med DeepSeek R1 og GPT-5, fant disse modellene de riktige ligningene for dynamiske systemer med mye lavere feil og mye raskere enn tidligere metoder. Og de gjorde det ved å forstå at en ligning måtte ha en "signumfunksjon" - ikke bare en polynom.

Hvordan mennesker og AI jobber sammen

Det største misforståelsen er at AI skal erstatte forskere. Det er ikke sant. Det er en ny form for samarbeid.

Hybridrammeverk som kombinerer retrieval-augmented generation (RAG) og case-based reasoning (CBR) gjør dette mulig. RAG lar modellen hente relevant litteratur i sanntid. CBR lar den huske tidligere forsøk og feil - og unngå dem.

En forsker skriver: "Jeg tror denne forbindelsen kan brukes som katalysator." AI svarer: "Du har testet en lignende forbindelse i 2022. Den hadde 87 % utbytte, men dekomponerte ved 60 °C. Denne nye forbindelsen har samme gruppe, men med en metylgruppe i stedet for etyl. Det kan redusere dekomponeringen. Jeg foreslår å teste den ved 55 °C og 70 °C." Det er ikke bare en forespørsel. Det er en dialog. En kollega som husker alt, men ikke glemmer hva som virket og ikke virket.

Tre forskere, menneske og AI, ser på en ny molekylstruktur i en stjerneskinnende forskningsrom, anime-stil.

Hva som fortsatt ikke fungerer - og hvorfor det er viktig

Selv de beste modellene har feil. En studie brukte en ny evalueringssystem kalt Scientific Discovery Evaluation (SDE). Den tester modeller på virkelige, iterative forskningsoppgaver - ikke bare på spørsmål som "hva er vannets formel?" Resultatet? En modell som klarer 90 % på en vitenskapelig eksamen, klarer bare 48 % på en virkelig forskningsoppgave. Årsaken? Det er ikke nok å vite. Man må kunne tenke gjennom flere trinn.

Men det er her det skjer et gjennombrudd. Når man slår på tenkningstillegget i DeepSeek, øker presisjonen på en kjemisk regeltest fra 65 % til 100 %. Det er ikke en liten forbedring. Det er en kvalitativ endring.

Likevel: ingen modell er en "vitenskapelig superintelligens". De har alle de samme svakheter: de forstår ikke kontekst som en menneskelig forsker, de kan "høre" feil i litteraturen og kopiere dem, og de har vanskeligheter med å håndtere usikkerhet.

Hva kommer neste?

Vi står ikke på toppen av en høyde. Vi står i bunnen av en fjellvegg.

De fremste modellene i 2026 er ikke de som har størst antall parametre. De er de som har best tenkning. De som kan forklare hvorfor de tror noe. De som kan endre vei når dataene sier at de har rett. De som kan samarbeide med mennesker som en kollega, ikke som en maskin.

Den neste store skrittet vil være modeller som kan skrive egne forskningsforslag, søke etter finansiering, og selv foreslå hvilke laboratorier som bør gjennomføre eksperimentene. Ikke fordi de vil ta over. Men fordi de kan gjøre det bedre - og raskere - enn vi kan.

Det er ikke science fiction. Det er det vi ser i laboratorier i Stanford, Berlin og Boulder akkurat nå. Og det er bare begynnelsen.

Hva er forskjellen mellom en vanlig stor språkmodell og en tenkningstyrket modell?

En vanlig stor språkmodell svarer basert på mønstre den har sett - den kan si hva en kjemisk formel betyr, men ikke hvorfor den er stabil. En tenkningstyrket modell kan følge en logisk kjede: "Denne gruppen gir elektron-donorer, som stabiliserer ladningen. Derfor vil denne forbindelsen være mer stabil enn en uten. Jeg foreslår å teste pH-avhengigheten." Det er ikke bare svar - det er vitenskapelig resonnering.

Kan en AI virkelig oppdage noe nytt, eller bare finne det som allerede er skrevet?

Den kan begge deler. Men den viktigste evnen er å se noe som ikke er skrevet. Eksempler: En modell som brukte MPPReasoner foreslo en ny type batterielektrode basert på en kombinasjon av to materialer som ingen hadde prøvd sammen. Den kom frem til det ved å sammenligne tusenvis av tidligere forsøk og identifisere et mønster: materialer med en spesiell krysset struktur hadde høyere energitett. Det var en ny hypotese - ikke bare en oppsummering av eksisterende data.

Hvorfor er "symbolic regression" viktig for vitenskapelig oppdaging?

Alle fysiske lover er matematiske ligninger. Newtons andre lov, Ohms lov, Schrödinger-ligningen - alle er enkle, men kraftfulle ligninger. Tradisjonelle metoder prøver millioner av ligninger til de finner en som passer. Tenkningstyrkede modeller bruker sin forståelse av fysikk for å begrense søket. De vet at en ligning for en bølge må ha en eksponentiell form. De vet at en reaksjonshastighet ikke kan være negativ. Det gjør at de finner riktige lover raskere og mer nøyaktig - og noen ganger oppdager en ny form som ingen har tenkt på før.

Hva er RAG og CBR, og hvorfor er de viktige?

RAG (Retrieval-Augmented Generation) lar modellen hente opp til date fra vitenskapelig litteratur i sanntid. CBR (Case-Based Reasoning) lar den huske tidligere forsøk - både suksesser og misligheter. Sammen gir de en modell som ikke bare vet noe, men også kan lære av erfaring. Det er som om du har en kollega som har lest alle artiklene og husker alle eksperimentene du har gjort de siste 10 årene - og kan si: "Du prøvde det før. Det virket ikke fordi du brukte for høy temperatur. Prøv igjen med 40 °C."

Er det trygt å la AI lede forskning?

Ikke alene. Men sammen med mennesker? Ja. Den største risikoen er at AI "hører" feil informasjon og tror den er riktig. Derfor er det viktig at mennesker alltid sjekker hypoteser, kontrollerer eksperimentdesign, og godkjenner resultater. AI er ikke en oracle - den er en kollega som er veldig god til å huske, regne og se mønstre. Men den trenger en menneskelig sjef som vet når noe virker som en ide, og når det virkelig er en oppdagelse.

Post Comments (9)

Gunnar Bye

March 3, 2026 AT 04:55

Denne tenkningstyrkede AI-en er ikke bare smart - den er som en overlegen kollega som alltid husker hva du prøvde for 3 år siden. Jeg har sett den gjøre det jeg har brukt uker på, på 12 timer. Og ja, den feiler noen ganger, men da er det ofte fordi vi ga den feil data. Ikke fordi den ikke tenker. Den tenker bedre enn mange av oss.

Olav Finne

March 3, 2026 AT 06:52

Det er viktig å ikke overdrive. AI kan analysere data og identifisere mønstre, men vitenskapelig tenkning krever forståelse av kontekst, etikk og usikkerhet. En modell kan ikke forstå at en hypotese kan være farlig å teste, selv om den matematisk ser bra ut. Det er menneskers ansvar - ikke maskinens.

Geir Isaksen

March 3, 2026 AT 09:04

hmmmm... jeg tror ikke det er noen som faktisk tror at en ai kan tenke. det er bare statistisk gjettning med fancy navn. de som sier det er "tenkning" er enten naive eller prøver å selge noe. alle disse "oppdagelsene" er bare tilfeldige kombinasjoner av eksisterende data. ingen ny vitenskap. bare ny marketing.

Kathinka Haugsand

March 4, 2026 AT 22:26

Det er så rart at folk tror AI kan være en "forsker". Du kan ikke bygge en vitenskapelig kultur på en maskin som ikke har evne til å forstå begrepet "feil" - bare "usannsynlig". Og så har vi folk som ser på en modell som foreslår en ny elektrode og sier "det er en oppdagelse!" - men det er bare en kombinasjon av to materialer som 17 andre har testet og forkastet. Jeg tror vi er på vei mot en ny form for pseudovitenskap. Med AI som ny vitenskapelig autoritet.

Kristine Lou

March 6, 2026 AT 15:29

har prøvd å bruke slike modeller i mitt arbeid og det er virkelig skikkelig hjelpsomt. ikke perfekt, men det som gjør at den er bra er at den husker alt. jeg sa til den "jeg prøvde dette før, men det virket ikke" og da sa den "ja, du brukte 65°C, men hvis du prøver 50°C med en annen løsning?" - og det fungerte. det er som å ha en kollega som aldri glemmer.

Olav Engh

March 7, 2026 AT 00:57

Det er så mye mer enn bare "hva hvis"-spørsmål. Når AI kan forklare *hvorfor* en reaksjon skjer, og ikke bare si at den skjer... da blir det virkelig vitenskapelig. Jeg så en modell forklare en ukjent reaksjon i en organisk syntese ved å referere til en 1987-artikkel som ingen hadde lest på 30 år. Og så ble det en ny publikasjon. Det er ikke bare hjelp. Det er inspirasjon.

espen solheim

March 7, 2026 AT 06:57

Det som virkelig er kult er at AI ikke har fordommer. Den ser ikke på hvem som skrev en artikkel. Den ser bare på data. Og noen ganger er det nettopp det som gjør at den ser noe vi har oversett. Ikke fordi den er bedre. Men fordi den ikke er menneskelig. Og det er ikke dårlig. Det er nyttig.

Even Ødegård

March 9, 2026 AT 00:37

AI som forsker? Hah! Det er bare Big Science som vil ta kontrollen. Vent til de begynner å skrive forskningsforslag for å få penger til å trene enda større modeller. Og så kommer de og sier "det er vitenskapelig oppdagelse" - men det er bare en algoritme som har lest de samme 10 artiklene 1000 ganger. Vi er i en fake vitenskapelig bubble. Og du vil ikke tro hva de gjør med dataene når ingen ser på.

Kristian Krokslett

March 9, 2026 AT 21:14

Det viktigste ikke er om AI kan tenke, men om den kan *forstå* at den ikke vet. De beste modellene i dag er ikke de som gir det mest overbevisende svaret, men de som sier: "Jeg er usikker på dette, jeg har ikke nok data, jeg anbefaler å teste dette først." Det er det som skiller en verktøy fra en partner. Og det er der vi står nå. Ikke som en overlegen maskin. Men som en kollega som enda ikke har fullt utviklet sin intuisjon.