AI Architecture · 10 Min.
AI-Agent-Architektur: Die 7 Schichten, die aus KI ein Business-System machen
Ein Agent wird nicht durch ein besseres Modell produktiv. Produktiv wird er erst, wenn Kontext, Tools, Rechte, Tests und Betrieb zusammen entworfen werden.
SYSTEMS Grafik zu AI Agent Architektur: Data -> Agent -> Outcome. Fokus: Welche technischen und operativen Schichten braucht ein produktiver KI-Agent im Unternehmen?
Kurzfassung
Produktive Agenten brauchen mehr als Prompt und Modell. Die entscheidenden Schichten sind Use Case, Kontext, Tools, Memory, Guardrails, Evals und Observability. Wer diese Schichten trennt, kann Agenten sicherer erweitern, messen und skalieren.
Strategischer Lesepfad
Baue das Thema im passenden Cluster weiter aus und verknüpfe es mit den nächsten Architekturentscheidungen.
Warum ein Agent kein Chatbot mit Werkzeugen ist Ein Chatbot beantwortet Fragen. Ein Agent verfolgt ein Ziel, nutzt Kontext, waehlt Werkzeuge, prueft Zwischenergebnisse und entscheidet, wann er stoppt. Genau deshalb ist ein Agent kein einzelnes Feature, sondern ein kleiner Betriebsprozess.
Das Problem: Viele Unternehmen bauen den Agenten von oben nach unten. Erst Modell, dann Prompt, dann ein paar Tools. Besser ist der umgekehrte Weg: Welche Arbeit soll verschwinden, welche Entscheidung muss sicher bleiben und welcher Zustand muss am Ende im System stehen?
Schicht 1: Der messbare Job Jeder Agent braucht einen scharfen Job. Nicht "Vertrieb automatisieren", sondern "neue B2B-Leads recherchieren, nach ICP sortieren und als priorisierte Liste ins CRM schreiben".
Ein guter Job hat ein pruefbares Ergebnis, klare Eingabedaten, eine wiederkehrende Frequenz und einen Grenzfall. Ohne diese Definition kann niemand sagen, ob der Agent Arbeit spart oder nur neue Kontrollarbeit erzeugt.
Schicht 2: Kontext statt Datenmuell Agenten scheitern selten an zu wenig Text. Sie scheitern an falschem Kontext. Der Agent braucht nicht alle Dokumente, sondern die richtigen Ausschnitte zur richtigen Zeit.
Diese Schicht entscheidet, ob der Agent praezise arbeitet oder nur plausibel klingt.
Rollenwissen: Was ist die Aufgabe des Agenten? Geschaeftskontext: Was ist das Ziel des Unternehmens? Prozesskontext: Welche Schritte sind erlaubt? Datenkontext: Welche Quellen gelten als verlaesslich? Entscheidungskontext: Wann muss ein Mensch rein?
Schicht 3: Tools mit engen Rechten Tools machen Agenten wertvoll und riskant zugleich. Ein Agent, der nur schreibt, kann sich irren. Ein Agent, der Daten veraendert, kann echten Schaden anrichten.
Deshalb braucht jede Tool-Schicht Rechte nach Risiko: lesen, vorschlagen, vorbereiten, ausfuehren. Die meisten ersten Agenten sollten mit Read-only oder Draft-Rechten starten. Erst wenn Evals und Logs stabil sind, werden Aktionen erweitert.
Schicht 4: Memory mit Zweck Memory ist kein Sammelbecken. Ein Agent sollte nur speichern, was spaeter bessere Entscheidungen erzeugt: Kundenpraeferenzen, wiederkehrende Korrekturen, Prozessregeln, gesperrte Aktionen oder Learnings aus erfolgreichen Laeufen.
Schlechtes Memory macht Agenten konfuser. Gutes Memory reduziert Wiederholung und macht Systeme lernfaehig.
Schicht 5: Guardrails und Freigaben Guardrails sind nicht nur Verbote. Sie sind Betriebsregeln. Ein Agent muss wissen, welche Daten sensibel sind, welche Aktionen irreversibel sind, welche Kostenlimits gelten und welche Ausgaben rechtlich oder kommerziell geprueft werden muessen.
Ein Human-in-the-Loop ist dabei kein Rueckschritt. Er ist der Hebel, der mehr Autonomie in sicheren Zonen erlaubt.
Schicht 6: Evals vor Rollout Ein Agent ohne Tests ist eine Demo. Evals pruefen Normalfaelle, Grenzfaelle und Missbrauchsfaelle. Sie zeigen, ob der Agent konstant genug arbeitet, bevor echte Prozesse davon abhaengen.
Wichtig ist, Evals nicht nur auf finale Antworten zu bauen. Auch Tool-Wahl, Abbruchgrund, Kosten und Korrekturbedarf gehoeren in die Bewertung.
Schicht 7: Observability und Betrieb Sobald ein Agent regelmaessig laeuft, braucht er Betrieb: Logs, Traces, Kosten, Fehlerraten, Freigabequoten, Nutzungsdaten und Ownership. Wer schaut rein, wenn ein Lauf falsch war? Wer pflegt den Eval-Satz? Wer erweitert Rechte?
Ohne Observability bleibt Agentic AI eine Black Box. Mit Observability wird sie ein steuerbarer Unternehmensbaustein.
Der SYSTEMS-Blick Die 7 Schichten sind kein Overengineering. Sie sind der Unterschied zwischen einem beeindruckenden Prototyp und einem System, das jede Woche Arbeit uebernimmt.
Der erste Agent muss nicht gross sein. Aber er muss architektonisch richtig gebaut sein: schmaler Job, klare Daten, enge Rechte, sichtbare Fehler und ein Betriebsmodell.