Oppmerksomhetsmekanismer i generativ AI: Fra Self-Attention til Flash Attention