Kurz gesagt
Ein Context Window ist die maximale Textmenge, die ein KI-Modell auf einmal berücksichtigen kann, gemessen in Tokens. Es umfasst alles, was im Spiel ist: den System Prompt, die Dateien oder Daten, die du einfügst, die bisherige Konversation und die Antwort, die das Modell schreibt. Stell es dir als das Arbeitsgedächtnis des Modells vor: Alles im Window kann die Antwort beeinflussen, und sobald das Window voll ist, fällt der älteste Inhalt praktisch aus dem Blick. Die Grösse des Context Window zu kennen und zu steuern, was du hineinlegst, ist zentral für gute, bezahlbare Ergebnisse.
Warum das Context Window zählt
Das Context Window setzt eine harte Obergrenze, wie viel das Modell auf einen Schlag berücksichtigen kann. Wenn deine Anweisungen, dein Code und der Verlauf es überschreiten, muss etwas gestrichen oder zusammengefasst werden, und das Modell kann Details verlieren, die du früher gegeben hast. Darum verlieren lange, ausufernde Chats den Faden, und darum schlägt eine frische, fokussierte Konversation oft das Anhäufen auf einer alten.
- Alles zählt: System Prompt, eingefügte Dateien, Verlauf und die Ausgabe teilen sich das Window.
- Wenn es voll wird, wird der älteste Inhalt gestrichen oder verdichtet und kann vergessen werden.
- Grösser ist nicht immer besser: Ein vollgestopftes Window kann das entscheidende Detail trotzdem begraben.
Grössen und das "Lost in the Middle"-Problem
Context Windows sind gross geworden, mit führenden Modellen 2026, die Hunderttausende Tokens bieten, und manche eine Million erreichen, genug, um eine ganze Codebase zu halten. Aber mehr Platz ist kein Freibier: Modelle können Informationen weniger Aufmerksamkeit schenken, die in der Mitte eines langen Kontexts vergraben sind, ein Effekt, der oft "Lost in the Middle" genannt wird. Den wichtigsten Kontext also nahe an Anfang oder Ende zu setzen und ihn relevant zu halten, schlägt weiterhin das Hineinkippen von allem.
Das Context Window steuern
Agent Harnesses stecken hier viel Aufwand hinein: Sie verdichten ältere Schritte zu Zusammenfassungen, kürzen irrelevanten Inhalt und lagern laute Nebenarbeit an Subagents aus, damit das Haupt-Window sauber bleibt. Die praktische Regel für dich ist dieselbe wie bei den Kosten: weniger, aber relevanteren Text senden. Gute Kontextverwaltung ist eine eigene Disziplin, manchmal Context Engineering genannt, und eine der hebelstärksten Fähigkeiten beim Bauen mit Agents.
