Checkpoint Averaging og EMA: Stabilisering av store språkmodeller