Voici le décodage spéculatif : grâce à lui, les modèles d'IA vont devenir plus rapides, et consommer moins de ressources