Treningstid og tokenmengde: Hvordan de påvirker LLM-generalisering