Auf einen Blick
Anthropic liefert Claude in drei Grössen, und die richtige zu wählen ist der einfachste, grösste Hebel auf Qualität und Rechnung zugleich. Opus ist das fähigste Modell für das härteste Reasoning, Sonnet der ausgewogene Arbeitsesel, der die meisten Coding- und Agent-Aufgaben gut meistert, und Haiku das schnelle, günstige Modell für volumenstarke und latenzkritische Arbeit. Sie teilen dieselben Kernfähigkeiten und 2026 einen 1M-Token-Kontext zum Standardpreis; was sich ändert, sind Reasoning-Tiefe, Tempo und Kosten pro Token. Diese Seite vergleicht sie ehrlich, damit du das Modell zur Aufgabe passt, statt Opus für Arbeit zu zahlen, die Haiku erledigen würde, oder ein wirklich schweres Problem an Haiku zu schicken und frustriert zu sein. Sie passt zu unserem Artikel Choosing an AI Model. Die Preise sind Listenpreise Stand 2026 und ändern sich über die Zeit.
Die Optionen
Direkt nebeneinander
| Dimension | Claude Opus | Claude Sonnet | Claude Haiku |
|---|---|---|---|
| Stufe | Am fähigsten | Ausgewogen | Am schnellsten und günstigsten |
| Am besten für | Härtestes Reasoning, Architektur, komplexe Refactorings | Die meiste Coding- und Agent-Arbeit | Hohes Volumen, einfache Aufgaben, latenzkritische Arbeit |
| Relative Fähigkeit | Am höchsten | Hoch | Gut für seine Grösse |
| Relatives Tempo | Am langsamsten | Schnell | Am schnellsten |
| Input-Preis pro Million (Stand 2026) | Rund USD 5 | Rund USD 3 | Rund USD 1 |
| Output-Preis pro Million (Stand 2026) | Rund USD 25 | Rund USD 15 | Rund USD 5 |
| Kontextfenster (2026) | 1M Token zum Standardpreis | 1M Token zum Standardpreis | Grosser Kontext |
Das Fazit
Mach Sonnet zu deinem Standard: es meistert die grosse Mehrheit der Coding- und Agent-Arbeit zu einem starken Qualität-zu-Kosten-Verhältnis, weshalb Claude Code es standardmässig nutzt. Greif zu Opus bei den wirklich schweren Problemen, komplexem Reasoning, kniffligen Refactorings und Architektur, wo sich seine zusätzliche Tiefe auszahlt, indem es beim ersten Mal richtig liegt. Steig auf Haiku ab für volumenstarke, einfache oder latenzkritische Arbeit wie Klassifikation, Extraktion und read-only Subagents, wo Tempo und Kosten mehr zählen als Spitzen-Reasoning. Ein starkes Muster ist, sie zu mischen: ein stärkeres Modell führt, während Haiku die günstige, schmale Nebenarbeit macht. Um die Kosten weiter zu senken, nutze Prompt-Caching für wiederholten Kontext und Batch-Verarbeitung für nicht dringende Jobs. Im Zweifel starte auf Sonnet und wechsle erst hoch oder runter, wenn eine Aufgabe es klar verlangt.
