Hvordan store språkmodeller bruker sannsynlighet for å velge ord