Niveau
Taper

Coût

10+ Jetons $/1m

La référence pédagogique

Les modèles d'IA réussissent bien aux examens, mais connaissent-ils la pédagogie et l'aide à l'apprentissage ? Nous avons créé le Benchmark Pédagogique pour vérifier si les modèles peuvent réussir les examens d'enseignants. À titre de comparaison, nous présentons également les résultats du benchmark MMLU, qui évalue les élèves lors des examens. Les pourcentages indiquent le nombre de questions auxquelles chaque modèle a répondu correctement. En savoir plus ici.

Loading...
Chargement des résultats....