Was ist ein Context Window in der KI?

Es ist die maximale Textmenge in Tokens, die ein Modell auf einmal berücksichtigen kann. Es umfasst den System Prompt, eingefügte Inhalte, den Konversationsverlauf und die erzeugte Antwort. Alles ausserhalb des Window kann die Antwort nicht beeinflussen.

Was passiert, wenn das Context Window voll ist?

Der älteste Inhalt wird gestrichen oder zusammengefasst, um Platz zu schaffen, sodass das Modell früher gegebene Details vergessen kann. Darum verlieren lange Chats den Faden, und darum gibt eine frische Konversation oft bessere Antworten.

Wie gross sind Context Windows 2026?

Sie reichen weit, mit führenden Modellen, die Hunderttausende Tokens bieten, und manchen, die eine Million erreichen, genug für eine ganze Codebase. Die genaue Grösse hängt vom Modell und Tarif ab, den du nutzt.

Was ist ein Context Window? Definition

Q: Ist ein grösseres Context Window immer besser?

Nicht immer. Ein grösseres Window hält mehr, aber Modelle können Inhalten weniger Aufmerksamkeit schenken, die in der Mitte eines langen Kontexts vergraben sind, der "Lost in the Middle"-Effekt. Relevanter, gut platzierter Kontext schlägt meist das blosse Mehr.

Warum das Context Window zählt

Das Context Window setzt eine harte Obergrenze, wie viel das Modell auf einen Schlag berücksichtigen kann. Wenn deine Anweisungen, dein Code und der Verlauf es überschreiten, muss etwas gestrichen oder zusammengefasst werden, und das Modell kann Details verlieren, die du früher gegeben hast. Darum verlieren lange, ausufernde Chats den Faden, und darum schlägt eine frische, fokussierte Konversation oft das Anhäufen auf einer alten.

Alles zählt: System Prompt, eingefügte Dateien, Verlauf und die Ausgabe teilen sich das Window.
Wenn es voll wird, wird der älteste Inhalt gestrichen oder verdichtet und kann vergessen werden.
Grösser ist nicht immer besser: Ein vollgestopftes Window kann das entscheidende Detail trotzdem begraben.

Grössen und das "Lost in the Middle"-Problem

Context Windows sind gross geworden, mit führenden Modellen 2026, die Hunderttausende Tokens bieten, und manche eine Million erreichen, genug, um eine ganze Codebase zu halten. Aber mehr Platz ist kein Freibier: Modelle können Informationen weniger Aufmerksamkeit schenken, die in der Mitte eines langen Kontexts vergraben sind, ein Effekt, der oft "Lost in the Middle" genannt wird. Den wichtigsten Kontext also nahe an Anfang oder Ende zu setzen und ihn relevant zu halten, schlägt weiterhin das Hineinkippen von allem.

Das Context Window steuern

Agent Harnesses stecken hier viel Aufwand hinein: Sie verdichten ältere Schritte zu Zusammenfassungen, kürzen irrelevanten Inhalt und lagern laute Nebenarbeit an Subagents aus, damit das Haupt-Window sauber bleibt. Die praktische Regel für dich ist dieselbe wie bei den Kosten: weniger, aber relevanteren Text senden. Gute Kontextverwaltung ist eine eigene Disziplin, manchmal Context Engineering genannt, und eine der hebelstärksten Fähigkeiten beim Bauen mit Agents.

Häufige Fragen

Verwandt

Begriff

Prompt Caching

Prompt Caching speichert den verarbeiteten Anfang eines Prompts, damit wiederholte Anfragen ihn wiederverwenden. Cache-Reads sind rund 90 Prozent günstiger.

Öffnen Begriff

System Prompt

Ein System Prompt ist die stehende Anweisung, die Rolle, Regeln und Verhalten eines KI-Modells vor jeder Nutzernachricht festlegt und die ganze Sitzung prägt.

Öffnen Begriff

Tool Calling

Tool Calling (alias Function Calling) ist, wenn ein KI-Modell oder Agent strukturiertes JSON ausgibt, um deinen Code eine Funktion ausführen zu lassen, statt nur zu antworten. Definition, Funktionsweise und der Bezug zu Tool Chaining und MCP.

Öffnen Begriff

Agent Harness

Ein Agent Harness ist das Gerüst um ein KI-Modell, das die Schleife betreibt, den Kontext verwaltet, Tool-Aufrufe verteilt und Sicherheit durchsetzt.

Öffnen Begriff

RAG (Retrieval-Augmented Generation)

RAG (Retrieval-Augmented Generation) gibt einem KI-Modell zur Antwortzeit relevante Dokumente zum Lesen, sodass die Antwort in deinen Daten verankert ist statt im Gedächtnis. Bedeutung, Funktionsweise und RAG vs Fine-Tuning.

Öffnen Grundlage

Was sind Tokens in KI?

Tokens sind die Textstücke, in denen KI-Modelle lesen und abgerechnet werden. Lerne, was ein Token ist, warum es für die Kosten zählt und wie es sich von einem Security-Token unterscheidet.

Öffnen

Was ist ein Context Window?

Kurz gesagt

Warum das Context Window zählt

Grössen und das "Lost in the Middle"-Problem

Das Context Window steuern

Häufige Fragen

Bereit, KI als Workflow zu nutzen?

Kurz gesagt

Warum das Context Window zählt

Grössen und das "Lost in the Middle"-Problem

Das Context Window steuern

Häufige Fragen

Was ist ein Context Window in der KI?

Was passiert, wenn das Context Window voll ist?

Ist ein grösseres Context Window immer besser?

Wie gross sind Context Windows 2026?

Verwandt

Bereit, KI als Workflow zu nutzen?

Einmal pro Woche bessere KI Workflows.