On premise vs cloud : quelle solution pour l'inférence d'un LLM open source ?