Die KI-Definition of Done: Human in the Loop ist kein Qualitätsstandard
In Kürze: Die KI-Definition of Done
Ihr Team hat eine Definition of Done für ein Produktinkrement. Für die mehr als 20 KI-gestützten Arbeitsergebnisse, die jede Woche nach außen gehen, existiert keine: Statusberichte, Stakeholder-E-Mails, Release Notes und Updates für die Geschäftsführung. Auf jedem steht der Name Ihres Teams. „Ich erkenne Qualität, wenn ich sie sehe“ ist der Standard, nach dem die meisten Teams tatsächlich arbeiten, und Sie können ihn weder prüfen noch einem neuen Teammitglied beibringen noch verteidigen, wenn sich eine Aussage als falsch herausstellt. Die KI-Definition of Done löst dieses Problem: eine Seite pro Aufgabentyp, vom Team vereinbart, bevor das Ergebnis das Team verlässt.
These: Die KI-Definition of Done ist ein Team vereinbarter kompakter Standard, den ein KI-gestütztes Arbeitsergebnis erfüllen muss, bevor es das Team verlässt. Sie schreiben eine Definition pro Aufgabentyp, nie pro Einzelaufgabe: eine für externe Statuskommunikation, eine für Zusammenfassungen von Datenanalysen, eine für Entwürfe von Backlog Items. Die KI-Definition of Done übernimmt die Disziplin der Scrum-Definition of Done und wendet sie auf Arbeit an, an der eine KI beteiligt war, insbesondere auf Ergebnisse, die nach außen gehen. Dies ist Stufe 4 des AI Delegation Lifecycle. Die folgenden Abschnitte behandeln die vier Fragen, die sie beantwortet, und wie Sie Ihre eigene KI-Definition of Done in 75 Minuten schreiben.
🎓 🇬🇧 The AI4Agile Online Course v3 — July 20, 2026, at $149 — Join the Waitlist
Sooner or later, a CFO will ask what your AI use actually returns. „It saves me time“ will not survive that meeting.
The first wave of AI adoption rewarded practitioners who learned to prompt. That skill still matters, and this course still teaches it. The second wave rewards something rarer: people who can turn individual AI use into knowledge that survives departures, spend that can be explained and steered, and output that organizations can trust. That work is process design and change management. You have been doing both for years, on harder problems than this.
The AI 4 Agile Online Course v3 is in English. 🇬🇧
What You Will Get:
✅ 16+ hours of self-paced video modules ✅ A cohort-hardened, proven course design ✅ Learn to 10x your effectiveness with AI; your stakeholder will be grateful ✅ Apply AI to classic use cases of “Agile” ✅ The A3 Framework, A3 Handoff Canvas, AI Definition of Done, and Delegation Retrospective as working handouts ✅ The complete MegaBrain.io case package across both acts ✅ All texts, slides, prompts, graphics; you name it ✅ Access custom GPTs, including the “Scrum Anti-Patterns Guide GTP” ✅ Guaranteed: Lifetime access to v3 ✅ AI4Agile Foundation Certificate: 40 questions in 45 minutes.
👉 Please note: The course will be available for $149 from July 20 to 27, 2026! (After that, $249.) 👈
🎓 Join the Waitlist now and be the first to know: The AI4Agile Online Course v3 — July 20, 2026, at $49 — No Coding Required!
🗞 Shall I notify you about articles like this one? Awesome! You can sign up here for the ‘Food for Agile Thought’ newsletter and join 35,000-plus subscribers.
🎓 Join Stefan in one of his upcoming training classes!
Ihr Produktinkrement hat einen Qualitätsstandard; hat Ihr KI-Ergebnis einen?
Ein Modell macht aus dem Jira-Board ein Freitags-Statusupdate, und dieses Update teilt einem potenziellen Unternehmenskunden mit, dass ein Sicherheitsfeature in Produktion ist. Das stimmt aber nicht. Drei Monate zuvor hatte das Team das Feature gestrichen, aber der alte Jira-Ticket-Titel blieb, weil sich niemand für die Aktualisierung zuständig fühlte. Das Modell meldete also den Titel, nicht den tatsächlichen Stand. Niemand prüfte die Aussage gegen die Release Notes, weil niemand vereinbart hatte, dass das jemand tun sollte. Die E-Mail ging unter dem Namen des Teams raus.
Ein funktionierendes agiles Team sollte Ihnen sagen können, was „Done“ für ein Produktinkrement bedeutet. Was „Done“ für dieses Statusupdate bedeutet, können die wenigsten beantworten. Kein vereinbarter Qualitätsstandard für KI-generierte Artefakte regelt das, obwohl das Statusupdate jede Woche verschickt wird. Das Produktinkrement orientiert sich an einem Standard, über den das Team diskutiert und den es vereinbart hat. Das KI-gestützte Ergebnis durchläuft das Bauchgefühl einer einzelnen Person in dem Moment, in dem diese auf Senden klickt. Eines davon können Sie vor einem Stakeholder, einem Auditor oder einem neuen Teammitglied verteidigen; Letzteres hingegen nicht.
Die KI-Definition of Done schließt diese Lücke, ohne eine Governance-Abteilung einzurichten, und genau deshalb überlebt sie in Organisationen, in denen „KI-Governance“ Augenrollen unter den Beteiligten auslöst. Sie nimmt eine Praxis, die jeder agile Praktiker bereits beherrscht, und richtet sie auf die Arbeit, die Sie begonnen haben, an ein KI-Modell zu delegieren. Sie ist nicht für alles gedacht: Überspringen Sie die KI-Definition of Done bei privatem Brainstorming, Einmalprompts oder persönlicher Sinnfindung, es sei denn, das Ergebnis fließt später in eine Entscheidung ein oder verlässt das Team.
Die vier Fragen, die jede KI-Definition of Done beantwortet
Das Konzept
Verifikationsstufe: Welche Aussagen werden geprüft, von wem, gegen welche Quelle und wie? „Sieht gut aus“ ist keine Methode. Eine Methode benennt die Aussage, den Prüfer, die Quelle und den Test: Der Absender prüft jede faktische Aussage zum Produktstatus vor dem Versand gegen die Release Notes, und dies jedes Mal. Wo Teams hängen bleiben: Die Freigabe wird mit Prüfung verwechselt: Jemand überfliegt einen Entwurf, klickt auf Senden, und der Name des Teams steht unter einer Aussage, die niemand verifiziert hat.
Herkunftsangabe: Was erklärt das Team darüber, wie das Ergebnis entstanden ist? Drei Bezeichnungen decken die Praxis ab: a) Human bedeutet keine wesentliche KI-Beteiligung an Inhalt, Aussagen oder Struktur (eine Rechtschreibprüfung zählt nicht). b) Assist bedeutet, dass eine KI zum Entwurf, zur Zusammenfassung oder zur Analyse beigetragen hat und eine namentlich benannte Person das Ergebnis geprüft und entschieden hat. c) Automate bedeutet, dass eine KI das Ergebnis nach vordefinierten Regeln erstellt und versendet hat, ohne menschliche Prüfung vor der Veröffentlichung, allerdings mit einem regelmäßigen Audit in festgelegten Intervallen. Die entscheidende Grenze verläuft bei „geprüft“: Auf Senden zu klicken, ohne den Entwurf gelesen zu haben, ist Freigabe, aber niemals eine Prüfung. Ein Ergebnis, das das Team ohne Lektüre freigibt, fällt in die Kategorie Automate, egal was es sich einredet.
Datenhygiene: Was darf auf dem Weg zu diesem Ergebnis nie in ein Modell gelangen? Benennen Sie die Ausschlüsse konkret: personenbezogene Daten aus Teamumfragen, kundenbezogene Informationen, alles, was die KI-Richtlinie Ihrer Organisation einschränkt. Wenn die Eingaberegeln in Ihrem A3 Handoff Canvas das bereits abdecken, verweisen Sie darauf. Pflegen Sie nicht zwei Versionen derselben Regel. Wo Teams hängen bleiben: Niemand hat die Ausschlüsse aufgeschrieben, also rät jeder für sich, und die Vermutungen gehen auseinander.
Ausreichende Stufe und Umgebung: Welches Modell, welcher Plan und welches Datenlimit reichen für diesen Aufgabentyp aus und warum? Ein erstklassiges Frontier-Modell kann beim Entwurf einer Kalendereinladung in dieser Hinsicht durchfallen. Das günstigste Modell, lokal auf einem alten Mac mini betrieben, kann ein Board-Update schreiben, versagt aber vermutlich in der anderen Hinsicht. Die Leistungsfähigkeit eines KI-Modells ist nur die halbe Miete: Ein Board-Update kann einen Enterprise-Plan mit einer Garantie gegen Trainingsdatennutzung oder einen freigegebenen Connector erfordern, selbst wenn ein Modell der Mittelklasse von der Leistung her ausreicht. Wenn Ihr Team eine Routing-Richtlinie hat, verweisen Sie auf die Stufe und die Umgebung, die sie vorschreibt. Falls nicht, benennen Sie das Modell und den Plan und erklären Sie in einem Satz, warum beides ausreicht.
Cannot see the form? Please click here.
Die Vorlage für die KI-Definition of Done
Vier Fragen plus zwei Steuerungselemente auf einer Seite. Hier ist die Vorlage, die ein Team pro Aufgabentyp ausfüllt:
- Aufgabentyp: [angeben]
- Verifikationsstufe: Was geprüft wird, von wem, gegen welche Quelle, wie
- Herkunftsbezeichnung: Human (Avoid) / Assist / Automate vom A3-Delegation-Framework, und wo die Bezeichnung erscheint
- Datenhygiene: Was nie in das Modell gelangt
- Ausreichende Stufe und Umgebung: Welches Modell, welcher Plan und welche Datengrenze, und warum sie ausreichen
- Freigabe: Wer zugestimmt hat, an welchem Datum, und der Überprüfungstermin
- Stoppregel: Wann die Delegation pausiert, herabgestuft oder auf manuelle Arbeit zurückgeführt wird.
Die letzten beiden Zeilen sind operativ, nicht definitorisch: Die Freigabe hält fest, wer wann zugestimmt hat, und die Stoppregel benennt die Bedingung, unter der die Delegation pausiert, denn dieser Standard sollte nicht nur sagen, wann ein Ergebnis nach außen gehen darf, sondern auch, wann der Aufgabentyp nicht mehr für eine KI in Frage kommt. Ohne die Stoppregel optimieren Teams den Prompt oder Skill weiter, lange nachdem sich die Delegation als untauglich erwiesen hat.
Ein ausgearbeitetes Beispiel: Externe Statuskommunikation
Der Fehler beim Statusupdate, mit dem dieser Artikel begann, gehört zu einem Aufgabentyp: Statuskommunikation, die das Unternehmen verlässt. Hier ist die erste KI-Definition of Done des Teams dafür:
- Aufgabentyp: Statuskommunikation, die das Unternehmen verlässt
- Verifikationsstufe: Der Absender prüft jede Aussage zum Feature-Status vor dem Versand gegen die Release Notes, jedes Mal
- Herkunftsbezeichnung: Assist; Fußzeile enthält „Entworfen mit KI, geprüft von [Name]“; AI-automated ist für diesen Aufgabentyp nicht zulässig
- Datenhygiene: Keine Kundennamen, keine Details zu Sicherheitsbefunden, keine internen Finanzdaten gelangen in das Modell
- Ausreichende Stufe und Umgebung: Modell der Mittelklasse auf einem Enterprise-Plan ohne Modelltraining; der Entwurf aus strukturierten Release-Daten erfordert kein Frontier-Modell
- Freigabe: Team hat zugestimmt, datiert; Überprüfung nach den nächsten vier Statusupdates
- Stoppregel: Wenn zwei Updates in einem Prüfzyklus nach dem Versand eine sachliche Korrektur benötigen, kehrt der Aufgabentyp zur manuellen Erstellung zurück, bis der Standard überarbeitet ist.
Dieser Standard kostet den Absender etwa 5 Minuten pro Woche, verglichen mit einem Fehler, der den Abschluss einer wichtigen Vereinbarung mit einem potentiellen Kunden gefährden kann.
Schreiben Sie Ihre KI-Definition of Done in 75 Minuten
Eine KI-Definition of Done, die eine einzelne Person herunterlädt und ins Wiki kopiert, verändert nichts. Erst die Auseinandersetzung über den Standard gibt ihm Wirkung. Führen Sie es als Workshop durch:
- Drei Aufgabentypen auswählen (10 Minuten): Wählen Sie aus Arbeit, die das Team in den letzten zwei Wochen tatsächlich geliefert hat, nie aus Hypothesen aus. Die besten Beispiele für KI-Arbeit sind Ergebnisse, die das Team verlassen.
- In Paaren entwerfen (20 Minuten): Jedes Paar füllt die Vorlage für einen Aufgabentyp aus. Die Paare arbeiten ohne Vergleich; die Unterschiede sind gewollt.
- Unterschiede ausdiskutieren (25 Minuten): Entwürfe vergleichen. Wo sich Paare bei Verifikationsstufe oder Herkunftsbezeichnung uneinig sind, hat das Team eine unausgesprochene Annahme gefunden. Lösen Sie jede Meinungsverschiedenheit mit einer Entscheidung, nie mit „beides ist in Ordnung.“
- Bezeichnungen festlegen (10 Minuten): Vereinbaren Sie, wo die Herkunftsbezeichnungen erscheinen: E-Mail-Fußzeilen, Kopfzeilen von Dokumenten, Berichtsdeckblätter. Sichtbare Bezeichnungen sind besser als versteckte.
- Verabschieden und datieren (10 Minuten): Zeichnen Sie jede KI-Definition of Done mit einem Überprüfungstermin ab und nehmen Sie die Verabschiedung in Ihre KI-Arbeitsvereinbarung auf.
Die Verantwortung bleibt beim Team, das die Delegation betreibt: Compliance, Security oder Legal können den Standard einschränken, aber sie schreiben ihn nicht für das Team.
Wenn jemand sagt: „Das brauchen wir für interne Ergebnisse nicht“, fragen Sie, was beim letzten Mal passiert ist, als jemand einen internen Entwurf außerhalb des Teams weiterleitete. Jedes Team kennt diese Geschichte.
Der Nachweis, den Sie gratis bekommen
Jede vereinbarte KI-Definition of Done ist ein datierter, versionierter Nachweis. Heben Sie diese Nachweise auf und sie beantworten die Due-Diligence-Frage, die Stakeholder zunehmend stellen, mit Dokumenten statt Zusicherungen: „Wie kontrollieren Sie KI-generierte Ergebnisse?“. Niemand hat einen Governance-Bericht geschrieben. Die Nachweise entstanden aus der normalen Arbeit.
Diese Antwort ist bereits Teil von Beschaffungs- und Due-Diligence-Gesprächen. Artikel 4 des EU AI Act wird seit dem 2. Februar 2025 angewandt und verpflichtet Anbieter und Betreiber, ein ausreichendes Maß an KI-Kompetenz bei Mitarbeitenden und anderen Personen sicherzustellen, die KI-Systeme in ihrem Auftrag bedienen. Die FAQ der EU-Kommission ordnen Aufsicht und Durchsetzung den nationalen Marktüberwachungsbehörden zu, wobei die Durchsetzungsregeln ab Anfang August 2026 gelten. Die praktische Frage hinter der Regulierung ist einfach und das Beschaffungsteam eines potenziellen Kunden wird sie sicherlich stellen: „Können Sie den Standard zeigen, der dem Ergebnis zugrunde liegt, das Sie uns geschickt haben?“
Drei Wege des Scheiterns
Der übernommene Standard: Jemand übernimmt die Vorlage ohne einen Workshop durchzuführen. Niemand hat darüber mit anderen diskutiert, also fühlt sich niemand verantwortlich. Eine KI-Definition of Done, über die niemand gestritten hat, wird niemand befolgen.
Der universelle Standard: Eine einzige KI-Definition of Done soll für alle Arbeiten gelten. Verifikation, die auf externe Kommunikation ausgerichtet ist, erstickt internes Brainstorming, und das Team gibt die Praxis innerhalb eines Monats auf. Es braucht eine Seite pro Aufgabentyp. Im Gegensatz zur klassischen Definition of Done gibt es in diesem Anwendungsfall keine Einheitslösung.
Der statische Standard: Das Team schreibt den Standard einmal und überprüft ihn nie. Modelle ändern sich, Menschen ändern sich, Aufgabentypen ändern sich. Der Überprüfungstermin ist Teil des Artefakts, und Ihre nächste Delegationsprüfung setzt ihn durch.
Fazit: Nehmen Sie sich diese Woche ein Ergebnis vor
Nehmen Sie sich ein KI-gestütztes Ergebnis vor, das Ihr Team regelmäßig verschickt: das Freitags-Statusupdate, die Sprint-Zusammenfassung oder die Stakeholder-E-Mail. Sprechen Sie es in Ihrer nächsten Retrospektive anhand der vier Fragen laut durch: Was wird geprüft und von wem? Wie kennzeichnen wir es? Was gelangt nie in das Modell? Welche Stufe reicht aus? Vermutlich finden Sie mindestens eine Frage, bei der die ehrliche Antwort lautet: „Das hat niemand entschieden.“ Erstellen Sie daraufhin einen Entwurf für diesen Aufgabentyp, diskutieren Sie diesen, geben Sie diesen frei und datieren Sie ihn. Ein einzige KI-Definition of Done, vom Team vereinbart, ist der Unterschied zwischen einem Team, das KI „nutzt“, und einem Team, dem ein Kunde die Arbeit mit KI zutraut.
Welches Ihrer KI-gestützten Ergebnisse basiert auf einem Qualitätsstandard und welches ist bloß taktische Gewohnheit?
Zentrale Fragen, die dieser Artikel beantwortet
Was ist eine KI-Definition of Done?
Eine KI-Definition of Done ist ein fokussierter, vom Team vereinbarter Standard, den ein KI-gestütztes Artefakt erfüllen muss, bevor es das Team verlässt. Teams schreiben eine Definition pro Aufgabentyp, etwa für externe Statuskommunikation oder Zusammenfassungen von Datenanalysen, jedoch nie eine pro Einzelaufgabe. Sie beantwortet vier Fragen: Was wird verifiziert? Wie wird das Ergebnis gekennzeichnet? Welche Daten gelangen nie in das Modell? Welches Modell und welche Umgebung reichen aus? Die KI-Definition of Done übernimmt die Disziplin der Scrum-Definition of Done und wendet sie auf Arbeit an, an der ein KI-Modell beteiligt war.
Was ist der Unterschied zwischen Freigabe und Prüfung bei KI-Ergebnissen?
Prüfung bedeutet, dass eine namentlich benannte Person das KI-generierte Ergebnis liest und die Aussagen vor dem Versand gegen eine Quelle prüft. Freigabe bedeutet, dass jemand auf Senden geklickt hat. Auf Senden zu klicken, ohne den Entwurf gelesen zu haben, ist Freigabe, nicht Prüfung, egal wie das Team es nennt. Ein KI-gestütztes Ergebnis, das ohne Lektüre freigegeben wird, ist faktisch „Automate“ nach dem A3-Entscheidungs-Framework und sollte diese Herkunftsbezeichnung tragen, nicht die Bezeichnung „Assist“, die impliziert, dass ein Mensch es verifiziert hat.
Wie schreiben Sie eine KI-Definition of Done?
Führen Sie einen 75-minütigen Team-Workshop durch, ein Download der Vorlage mit Ausfüllen im Alleingang reicht nicht. Wählen Sie drei Aufgabentypen aus der Arbeit der letzten zwei Wochen, entwerfen Sie den Standard in Paaren, vergleichen Sie dann die Ergebnisse und lösen Sie jede Meinungsverschiedenheit mit einer Entscheidung. Vereinbaren Sie, wo die Herkunftsbezeichnungen erscheinen, legen Sie eine Stoppregel fest, die den Aufgabentyp zur manuellen Erstellung zurückführt, wenn Ergebnisse wiederholt scheitern, geben Sie jeden Standard mit einem Überprüfungstermin frei und nehmen Sie die Annahme in die KI-Arbeitsvereinbarung Ihres Teams auf. Erst die Auseinandersetzung über den Standard macht ihn zum „Eigentum“ des Teams.
Wie weisen agile Teams nach, dass sie KI-Ergebnisse steuern?
Jede freigegebe KI-Definition of Done ist ein datierter Nachweis. Zusammen beantworten die Standards eines Teams die Beschaffungs- und Due-Diligence-Frage „Wie kontrollieren Sie KI-generierte Ergebnisse?“ mit Dokumenten statt Zusicherungen. Die Nachweise sind ein Nebenprodukt der normalen Arbeit, ein separater Governance-Bericht ist nicht mehr nötig. Das ist relevant, weil Einkäufer und Regulierer, auch im Rahmen von Artikel 4 des EU AI Act, zunehmend Belege für eine kontrollierte KI-Einführung verlangen.
Was sind die vier Dimensionen einer KI-Definition of Done?
Die vier Dimensionen umfassen die Verifikationsstufe (welche Aussagen geprüft werden, von wem, gegen welche Quelle und wie), eine Herkunftsangabe (Human/Avoid, Assist oder Automate nach dem A3-Entscheidungs-Framework und wo die Bezeichnung erscheint), die Datenhygiene (was nie in das Modell gelangt) und die ausreichende Stufe und Umgebung (welches Modell, welcher Plan und welche Datengrenze ausreichen und warum). Jede Dimension passt auf eine Zeile der einseitigen Vorlage, freigegeben mit einem Übernahmedatum und einer Stoppregel, welche die Delegation einer Aufgabe an ein KI-Modell pausiert, wenn Ergebnisse wiederholt scheitern.
KI-Definition of Done — Weitere Lektüre
AI4Agile Online Course v3 — Release on July 20, 2026
KI-Delegations-Lebenszyklus: Wo sind die Entscheidungen, die zu den KI-Outputs geführt haben?
Der A3-Handoff-Canvas: Sechs Fragen zum Verständnis der Delegierung von KI-Aufgaben
Das A3-Rahmenwerk: Ein Entscheidungssystem für KI-Delegation
Assist, Automate, Avoid: Wie agile Praktiker mit dem A3-Rahmenwerk unersetzlich bleiben
Schluss mit billigem Claude: Vier Grundprinzipien der Token-Ökonomie im Jahr 2026
Drei Claude Skills für Ihr Urteilsvermögen
👆 Stefan Wolpers: The Scrum Anti-Patterns Guide (Amazon advertisement.)
📅 Professional Scrum-Schulungen nach Scrum.org, Workshops und Events
Sie können sich Ihren Platz für KI- und Scrum-Schulungen, Workshops und Meetups direkt sichern, indem Sie dem entsprechenden Link in der Tabelle unten folgen:
| Date | Class and Language | City | Price |
|---|---|---|---|
| 🖥 💯 🇬🇧 July 1,2026 | GUARANTEED: HoA 75: Token Economics. (English) | Meetup | FREE |
| 🖥 💯 🇬🇧 July 20,2026 | GUARANTEED: AI 4 Agile Course v3 — Master AI for Agile Practitioners (English; Self-paced Online Course) | Self-paced Online Course | $149 incl. 19% VAT (If applicable.) (Before and after: $249) |
| 🇩🇪 August 25-26, 2026 | Professional Scrum Product Owner Training (PSPO I; German; Live Virtual Class) | Live Virtual Class | €1.299 incl. 19% VAT (If applicable.) |
| 💯 🇬🇧 August 27 to September 17,2026 | GUARANTEED: AI4Agile BootCamp #8 (English; Live Virtual Cohort) | Live Virtual Cohort | €499 incl. 19% VAT (If applicable.) |
Alle kommenden Professional-Scrum-Klassen finden Sie hier.
Sie können Ihren Platz für die Schulung direkt buchen, indem Sie dem entsprechenden Link zum Ticketshop folgen. Sollte der Beschaffungsprozess Ihrer Organisation einen anderen Einkaufsprozess erfordern, wenden Sie sich bitte direkt an die Berlin Product People GmbH.
✋ Nicht versäumen: Einen Erfahrungsaustausch über die KI-Definition of Done gibt es im 20.000-köpfigen „Hands-on Agile“ Slack-Team
Ich lade Sie ein, sich dem „Hands-on Agile“ Slack-Team anzuschließen und die Vorteile einer schnell wachsenden, lebendigen Gemeinschaft agiler Praktikern aus der ganzen Welt zu genießen.
Wenn Sie jetzt beitreten möchten, müssen Sie nur noch Ihre Anmeldeinformationen über dieses Google-Formular angeben, und ich werde Sie anmelden. Die Mitgliedschaft ist kostenlos.
Reflektieren Sie über das Thema KI-Definition of Done, indem Sie den kostenlosen Scrum Anti-Patterns Guide lesen: