Tag: residual connections

August 1, 2025
Comments 9
Teknologi og kunstig intelligens

Residual Connections og Layer Normalization i Store Språkmodeller: Grunnleggende for stabil trening

Residual connections og layer normalization er nøkkelen til å trene dype store språkmodeller. Uten dem ville GPT, BERT og Llama ikke eksistert. Her forklarer vi hvordan de fungerer, hva som skiller Pre-LN fra Post-LN, og hvilke praktiske valg du må treffe.