De l'image au son, OpenAI met le cap sur le multimodal