Sonnet 5 ist seit gestern da. Und für den Mittelstand verschiebt sich damit die Kostenrechnung für KI-Agenten.

Sonnet 5 ist seit gestern da. Und für den Mittelstand verschiebt sich damit die Kostenrechnung für KI-Agenten.

Anthropic hat am 30. Juni 2026 Claude Sonnet 5 veröffentlicht. Für Sie als Geschäftsführer, Digitalisierungsverantwortlicher oder Leiter Technische Dokumentation zählt dabei eine praktische Frage: Welche Arbeit können Sie ab heute mit KI-Agenten günstiger erledigen, ohne dass die Qualität nachlässt? Für den Mittelstand entscheidet die Antwort darüber, ob sich der Einsatz rechnet.

Sonnet 5 ist ein Werkzeug. Wie jedes Werkzeug taugt es für eine bestimmte Klasse von Aufgaben. Was sich verschoben hat, ist die wirtschaftliche Schwelle, ab der sich KI-Agenten im Mittelstand rechnen.

Was Anthropic für Claude Sonnet 5 berichtet

Die Eckdaten zuerst, attribuiert als Anthropic-Angaben. Auf SWE-bench Pro, einem Test für Softwareentwicklung an realen Projekten, berichtet Anthropic 63,2 %, gegenüber 58,1 % beim Vorgänger Sonnet 4.6 und 69,2 % bei der Spitzenstufe Opus 4.8. Im Terminal-Bench 2.1, der prüft, ob ein Modell Aufgaben eigenständig über die Kommandozeile löst, stehen 80,4 %, vorher 67,0 %. Ein weiterer Wert misst, wie gut das Modell während des Nachdenkens Werkzeuge einbezieht: also eine Suche aufruft, Code ausführt oder eine Datenbank abfragt und die Ergebnisse in seine nächste Überlegung einarbeitet. Hier meldet Anthropic 57,4 % gegenüber 46,8 %. Auf OSWorld-Verified, dem Test für die Bedienung eines Rechners über die grafische Oberfläche, sind es 88,3 %, während die dortige Experten-Vergleichsmarke bei 72,4 % liegt. Für Wissensarbeit meldet Anthropic 1618 Punkte, knapp vor Opus 4.8 mit 1615.

Diese Zahlen kommen vom Hersteller und ich nehme sie als das, was sie sind: berichtete Messwerte aus den Tests des Anbieters. Vor Ihrem Produktivbetrieb gehört eine eigene Prüfung an Ihren Daten in jedes saubere Vorgehen, so wie ich es an einer CCMS-Betriebsanleitung gemessen habe.

Der Preis bringt die zweite Hälfte der Geschichte. Bis 31. August 2026 verlangt Anthropic 2 US-Dollar je Million Eingabe-Token und 10 US-Dollar je Million Ausgabe-Token, danach 3 und 15 US-Dollar. Das ist ein Bruchteil dessen, was die Opus-Stufe kostet. Für Werkzeug- und Wissensarbeit liegen Sonnet 5 und Opus 4.8 nach den Anthropic-Werten dicht beieinander. Für Architektur, tiefes Debugging und die wirklich schweren Fälle bleibt Opus 4.8 vorn.

Modellwahl: Routinearbeit vom Architektur-Anteil trennen

Wie sieht Ihre Arbeit für einen KI-Agenten von außen aus? Sie zerfällt in eine breite Fließband-Schicht und eine schmale Architekturschicht. Die breite Schicht: Bausteine umbauen, Inhalte aus dem CCMS prüfen, Übersetzungs-Aufträge anstoßen, Status-Updates erzeugen, Tickets klassifizieren, einfache Recherchen. Die schmale Schicht: eine Modulstruktur entwerfen, ein Datenmodell glattziehen, einen schwer reproduzierbaren Fehler einkreisen, eine Konzept-Entscheidung treffen, die sich später nicht mehr leicht zurücknehmen lässt.

Wer beide Schichten mit dem teuersten Modell fährt, bezahlt jeden Akkord-Vorgang zum Architekten-Tarif. Das ist betriebswirtschaftlich unnötig. Genau hier setzt das Modell-Tiering an: Sie ordnen Ihre Abläufe nach Schwere und wählen je Stufe das passende Modell-Niveau.

Wie wir bei Schübeler Consulting agentenbasiert arbeiten

Wir arbeiten selbst seit längerem mit mehreren Agenten parallel. Ein stärkeres Modell plant und orchestriert, mehrere schmale Agenten erledigen abgegrenzte Teilaufgaben: Webseiten-Bau, Recherche, Prüfdurchläufe, Datenextraktion, mechanische Umbauten an Texten und Code. Die Praxis-Lehre daraus ist trocken. Für Routinearbeit genügt ein schnelles, günstiges Modell, das Werkzeuge sauber bedient und seinen eigenen Zwischenstand nicht vergisst. Bei der Masse dieser Vorgänge senkt das die Kosten erheblich.

Sonnet 5 fällt nach den berichteten Zahlen genau in diese Lücke. Es plant Schritte über längere Strecken, bedient Browser und Terminal, hält den Faden auch bei verzweigten Abläufen. Die harte Architekturarbeit gebe ich weiter an die Opus-Stufe. Dort zahle ich den höheren Preis bewusst, weil die Folgen einer falschen Entscheidung teurer wären als jeder Modell-Aufpreis.

KI-Agenten im Mittelstand: was das für Ihr Haus bedeutet

Sortieren Sie Ihre Abläufe nüchtern in zwei Klassen. Zum Akkord gehört alles, was sich wiederholt: tippen, prüfen, klassifizieren, übersetzen, formatieren, weiterleiten. Zur Architektur gehört das Schwere, also Konzept-Entwürfe, die Fehlersuche in komplexen Systemen und Entscheidungen über Strukturen, die Ihr Haus über Jahre stützen. Den Akkord-Anteil schätzen viele Häuser zu klein. In den meisten Technischen Redaktionen, die ich kenne, fällt die Mehrheit der täglichen Vorgänge in die Fließband-Schicht.

Messen Sie den Token-Verbrauch je Stufe, bevor Sie eine pauschale Modell-Wahl treffen. Wer das nicht tut, fliegt blind. Sie würden auch keinen Lagerplatz neu vergeben, ohne die Umschlagshäufigkeit der Artikel zu kennen.

Halten Sie die Schnittstellen offen. Bauen Sie Ihre Abläufe so, dass das Modell hinter dem Vorhang austauschbar bleibt. Das ist die wirtschaftliche Seite der Architektur, über die ich Anfang 2026 in Multi-LLM-Orchestrierung: Architektur statt Abo-Upgrade geschrieben habe: funktionale Spezialisierung über mehrere Modelle, klare Verantwortlichkeiten je Stufe, austauschbare Komponenten. Modell-Tiering ist die Kostenrechnung zu genau diesem Bauplan.

Und behalten Sie das Anbieterrisiko im Blick. Die Abschaltung von Fable 5 und Mythos 5 per US-Anordnung im Juni 2026 hat vielen Verantwortlichen vor Augen geführt, was passiert, wenn ein Modell von heute auf morgen verschwindet. Tiering senkt Ihre laufenden Kosten, an der Verfügbarkeit ändert es aber nichts. Souveränität bleibt Risikomanagement. Wer mehrgleisig fährt, ordnet Modelle nach Aufgabe und hält für jede Stufe eine Ausweichoption bereit, deren Schnittstellen er kennt.

Mein Rat für die nächsten Wochen

Setzen Sie Sonnet 5 jetzt nicht überall ein, nur weil der Einführungspreis günstig ist. Beginnen Sie mit den zwei oder drei Abläufen, in denen Sie heute viele wiederkehrende Vorgänge mit einem teureren Modell abfertigen. Stellen Sie um, messen Sie eine Woche, vergleichen Sie Token-Verbrauch und Qualität. Wenn die Qualität hält, dehnen Sie aus. Wenn nicht, sehen Sie, warum, und ziehen die schwere Aufgabe bewusst auf Opus zurück.

Sonnet 5 macht KI-Agenten im Mittelstand für mehr Häuser wirtschaftlich. Welches Modell für welche Aufgabe läuft, entscheiden Sie weiterhin selbst anhand Ihrer eigenen Abläufe.

Kommentar schreiben