Core Loop

AI-first engineering at scale

Thema

KI-First Postmortems und passives Lernen

Warum KI-Teams dieselben Fehler immer wieder machen

Daniel Leblond April 2026

Die meisten KI-Vorfälle sind nicht auf eine einzige Katastrophe zurückzuführen. Sie entstehen aus einer Kette kleiner Fehler, die niemand aufschreibt, während sie passieren.

Passives Lernen ist der fehlende Muskel. Sie erhalten es nur, wenn jeder Vorfall Artefakte hinterlässt, die leicht zu finden, zu vergleichen und wiederzuverwenden sind.

Die Ergebnisse von Five Whys sind in Reparaturmaßnahmen und organisatorische Lernsignale unterteilt: Was wird sofort behoben und was wird zur Leitplankenrichtlinie?

Fünf Elemente einer nützlichen Postmortem-Analyse der KI-Ära

Element Was zu erfassen ist Warum es wichtig ist
Trigger Der genaue Benutzerpfad, die Eingabeaufforderung oder das Commit, die das Problem aufgedeckt haben Entfernt das Geschichtenerzählen im Nachhinein
Beobachtetes Verhalten Protokolle, Spuren, Screenshots und fehlgeschlagene Prüfungen Verhindert Speicherdrift
Entscheidungsprotokoll Was berücksichtigt, abgelehnt und akzeptiert wurde Macht Kompromisse sichtbar
Sanierungsnachweise Beweis, dass der ausgewählte Fix unter Bedingungen funktioniert, die zuvor fehlgeschlagen sind Stoppt „in der Theorie festgelegte“ Behauptungen
Aktualisierung der Leitplanke Neuer Test, Lint-Regel, Runbook-Schritt oder Richtlinien-Gate Wandelt einmaligen Schmerz in wiederholbare Prävention um
Automatisierter Postmortem-Handling-Lebenszyklus: Auslösererfassung, Beweiserfassung, Musterklassifizierung und automatisierte Präventionsbereitstellung.

Passives Lernen ist ein System, kein Meeting

Der Satz „Wir haben daraus gelernt“ ist nur dann wahr, wenn das Lernen personelle Veränderungen und die Zeit überdauert.

Eine praktische passive Lernschleife: Erfassen Sie eine Zeitleiste, machen Sie einen Snapshot von fehlgeschlagenen und korrigierten Zuständen nebeneinander, klassifizieren Sie das Fehlermuster, fügen Sie einen obligatorischen Präventionsmechanismus hinzu und überprüfen Sie diesen Mechanismus bei der nächsten ähnlichen Änderung.

Autonomie-Entscheidungsmatrix: wann die Reaktion auf Vorfälle automatisiert werden sollte, wann eine menschliche Überprüfung erforderlich ist und wann eine Eskalation für Richtlinienaktualisierungen erforderlich ist.

Wie ausgereifte KI-Postmortems aussehen

Erfahrene Teams behandeln Vorfallbeweise als erstklassiges Artefakt und nicht als Aufräumaufgabe. Sie unterscheiden Modellfehler von menschlichen Prozessfehlern. Sie begünstigen schnell wiederkehrende Ausfälle automatisierter Tore.

Wenn ein Postmortem-Element fehlt, wird das Postmortem zur historischen Fiktion. Die unten aufgeführten wiederkehrenden Muster treten wiederholt bei Teams und Cloud-Anbietern auf.

Pattern Symptom Grundursache Starke Gegenmaßnahme
Sofortiges Zielfernrohrleck KI ändert Dateien außerhalb der vorgesehenen Grenzen Lockerer Aufgabenrahmen und schwache Überprüfungsoberfläche Umfangreiche Diff-Prüfungen und explizite Datei-Zulassungslisten
Falsche grüne Tests CI besteht, aber das Verhalten ist falsch Assertions testen Implementierungsdetails, nicht Ergebnisse Behauptungen und Fail-First-Prüfungen auf Vertragsebene
Unsichere Fallback-Logik Silent Fallback verbirgt Fehler Zweige ohne Beobachtbarkeit „weiterführen“. Strukturierte Fehlerbudgets und obligatorische Telemetrie
Drift nach der Zusammenführung Die Qualität der Codebasis lässt Tage später nach Fix ohne Richtlinien- oder Dokumentensynchronisierung zusammengeführt Post-Merge-Verifizierung plus Docs Gate
Passive Lern-Scorecard: Messung, wie gut postmortale Artefakte überleben, wie auffindbar sie sind und wie oft sie ein erneutes Auftreten verhindern.

Erstellen Sie eine Postmortem-Bibliothek, die Entwickler tatsächlich nutzen

Wenn das Auffinden früherer Vorfälle länger dauert als das Wiederherstellen des Fehlers, wird niemand das Archiv konsultieren.

Eine nutzbare Bibliothek unterstützt die Suche nach Fehlermustern, kurze „Was soll kopiert werden“-Abschnitte mit gebrauchsfertigen Prüfungen, Links von Runbooks und PR-Vorlagen sowie eine Abschlussbedingung, die bestätigt, dass die Prävention in den Tools erfolgt ist.

Ein praktisches Startpaket für Teams

  • Eine Post-Mortem-Vorlage, die Beweislinks erfordert.
  • Eine Taxonomie mit weniger als 12 Fehlermustern.
  • Eine Richtlinie, nach der jeder Vorfall eine Präventionsmaßnahme nach sich ziehen muss.
  • Ein monatlicher Scan auf die Häufigkeit wiederholter Muster.
  • Eine leichtgewichtige Qualitätsbewertung, um abgestandene Lektionen in den Ruhestand zu schicken.
Zur Startseite

Quellen

  1. Qodo (2025) Stand der KI-Codequalität im Jahr 2025
  2. METR (2025) KI-Tools machten erfahrene Entwickler um 19 % langsamer
  3. Martin Fowler / Kief Morris (2025) Wie weit können wir die KI-Autonomie bei der Codegenerierung vorantreiben?
  4. Simon Willison (2025) Agenten-Engineering-Muster
  5. Addy Osmani (2026) KI schreibt Code schneller. Ihre Aufgabe besteht immer noch darin, zu beweisen, dass es funktioniert.
  6. Microsoft .NET-Team (2026) Zehn Monate mit Copilot Coding Agent in Dotnet/Runtime