Benchmark Transfer Etter Fine-Tuning: Slik Generaliserer LLM-er På Tvers av Oppgaver