Welches KI-Modell taugt für die Technische Dokumentation? Ich habe Mistral-Medium-3.5 und Opus 4.8 an einer CCMS-Betriebsanleitung gemessen.
Die großen KI-Vergleiche kenne ich. MMLU prüft Fachwissen quer durch die Disziplinen, SWE-bench lässt Modelle reale Software-Tickets aus offenen Repositories lösen, dazu kommen Tests für Mathematik und logisches Schließen.