Ebene
Typ

Kosten

10+ $/1 Mio. Token

Der Pädagogik-Benchmark

Die meisten Benchmarks testen, ob LLMs die Prüfungen bestehen können. Wir haben den Pedagogy Benchmark entwickelt, um pädagogisches Wissen zu testen – können LLMs die Lehrerprüfung bestehen? Zum Vergleich haben wir Inhaltswissenswerte anhand von MMLU, einem etablierten Benchmark, aufgenommen. Mehr erfahren Hier.

Loading...
Ergebnisse laden....