Évaluer les LLM, un défi : le cas Hugging Face