Was ist ein KI-Agent — und was nicht

Wir bekommen wöchentlich Anfragen, die mit "wir wollen einen KI-Agenten bauen" anfangen. Wenn wir dann nachfragen, was genau gemeint ist, bekommen wir fünf verschiedene Antworten — und keine davon trifft, was wir intern unter Agent verstehen.

Das Problem: Der Begriff wird inflationär benutzt. ChatGPT mit Custom Instructions ist plötzlich ein "Agent". Eine n8n-Automation, die auf einen Webhook reagiert, ist ein "Agent". Sogar simple If-Else-Bots werden als "agentenbasiert" verkauft. Wenn alles ein Agent ist, ist nichts mehr ein Agent.

Unsere Arbeits-Definition

Für uns ist ein KI-Agent ein System, das drei Eigenschaften gleichzeitig hat:

Es hat ein Ziel, nicht nur eine Anweisung. "Buche mir einen Termin mit dem Steuerberater im Juni" ist ein Ziel. "Schreibe diese E-Mail um" ist eine Anweisung.
Es kann Tools benutzen, um das Ziel zu erreichen — Mails lesen, Kalender abfragen, Webseiten aufrufen, Datenbanken befragen.
Es entscheidet selbst, in welcher Reihenfolge welche Tools benutzt werden, und reagiert auf Zwischenergebnisse.

Wenn ein System nur eines oder zwei dieser drei Dinge tut, ist es kein Agent. Es ist eine Automation, ein Chatbot, ein Workflow, ein RAG-System — alles legitime und nützliche Konzepte, aber eben keine Agents.

Beispiele aus unserem Alltag

Ist ein Agent

Unser Telefon-Bot bei Flavored Media. Wenn jemand anruft und niemand abnimmt, übernimmt er. Er hat das Ziel "qualifiziere den Anrufer und finde einen Termin". Dafür greift er auf den Google-Kalender zu, fragt strukturiert nach (warum der Anruf, wie dringend, welches Budget), schlägt drei Slots vor und schickt anschließend eine Mail an uns mit Zusammenfassung. Welche Frage er als nächstes stellt, entscheidet er basierend auf der vorherigen Antwort — nicht nach festem Skript.

Ist kein Agent

Unser n8n-Workflow für die Steuer-Mail-Triage. Eine neue Mail kommt rein, ein Prompt klassifiziert sie (Beleg / Mahnung / Sonstiges), und je nach Kategorie wird sie in einen Ordner abgelegt oder weitergeleitet. Das ist ein klassischer Workflow mit KI als Klassifikator. Funktioniert hervorragend — aber es ist kein Agent, weil das System weder ein Ziel verfolgt noch Tools eigenständig wählt.

Schwierig zu kategorisieren

Custom GPTs mit Actions. Sie haben ein vages Ziel ("hilf dem Nutzer mit X"), können API-Calls machen — aber die Aktionen sind meist hart vorgegeben und der "Agent" reagiert nur auf direkte Nutzer-Anweisungen. Wir würden sagen: eher fortgeschrittener Chatbot, weniger Agent.

Warum die Unterscheidung wichtig ist

Weil sich die richtige Tool-Wahl, die Komplexität und der Preis dramatisch unterscheiden.

Ein Workflow lässt sich in 1-2 Tagen aufsetzen, läuft auf n8n oder Make für ein paar Euro im Monat, und funktioniert stabil. Ein echter Agent braucht Tool-Aufrufe (Function Calling), Fehlerbehandlung, Loops, Memory zwischen Schritten — das ist eine andere Komplexitäts-Klasse. Setup-Zeit: Tage bis Wochen. Laufkosten: 50-500 Euro pro Monat plus Modell-Kosten.

Wenn ihr für eine Aufgabe einen Workflow gebrauchen könnt, baut keinen Agent. Das ist Overengineering und teurer im Betrieb.

Wann ihr wirklich einen Agent braucht

Faustregel: Wenn die Aufgabe so unstrukturiert ist, dass ihr keinen festen Ablauf vorgeben könnt, und das System auf Zwischenergebnisse reagieren muss.

Konkrete Beispiele aus echten Kundenprojekten:

Recherche-Aufträge: "Finde mir die letzten drei Pressemeldungen zu Anbieter X und vergleiche sie mit Y." Der Agent entscheidet, welche Quellen er anschaut, wie tief er liest, wann er genug Material hat.
Erstkontakt-Qualifizierung: "Sprich mit dem Anrufer, finde raus was er braucht, schlage Termine vor." Jeder Anrufer ist anders, der Agent passt seine Strategie an.
Mehrstufige Buchungsprozesse: "Buche einen Tisch in einem Restaurant, das sowohl vegetarisch als auch hundefreundlich ist, im Umkreis von 5km." Mehrere Tools, mehrere Filter, möglicherweise mehrere Versuche.

Wenn ihr das Wort "und" oder "oder" oder "je nachdem" in der Aufgabenbeschreibung benutzt — könnte ein Agent passen. Wenn ihr eine geradlinige Pipeline beschreibt — nehmt einen Workflow.

Was Marketing-Bullshit ist

Drei Aussagen, bei denen wir immer skeptisch werden:

"Unser Agent lernt automatisch." Nein. LLMs ohne explizites Fine-Tuning oder Memory lernen nichts. Was der Anbieter meint, ist meistens: "Wir loggen alles und verbessern den Prompt manuell." Das ist nicht falsch, aber auch kein Lernen.
"Vollautonom." Wenn ein Agent in der Produktion vollautonom Geld ausgibt, Termine bucht oder Nachrichten verschickt, ohne Human-in-the-Loop, geht das früher oder später schief. Wir bauen immer Approval-Schritte ein. Wer "vollautonom" verkauft, hat entweder noch keinen Kunden in Produktion oder Mut zur Lücke.
"Agenten ersetzen Mitarbeiter." In den allermeisten Fällen ergänzen sie Mitarbeiter — sie übernehmen die langweiligen Vorbereitungs- und Klassifizierungsschritte. Wer "Mitarbeiter ersetzen" verkauft, redet entweder über sehr eng definierte Stellen oder verkauft Hype.

Fazit: Bevor ihr "Agent" sagt, fragt euch: Hat das System ein Ziel, kann es Tools nutzen, entscheidet es selbst? Wenn ja, ist es ein Agent — und ihr braucht andere Werkzeuge als für einen Workflow. Wenn nein, nennt es nicht so. Das spart euch Geld und Frust.

Wenn ihr unsicher seid, was ihr braucht: genau dafür gibt es das KI-Audit. Wir schauen uns euren konkreten Anwendungsfall an und sagen euch, ob Agent, Workflow, Chatbot oder gar nichts davon die richtige Lösung ist.

Klingt nach eurer Frage?

Im KI-Audit klären wir genau das: was ihr braucht, was ihr nicht braucht, und mit welchem Stack ihr starten solltet. Halber Tag, Festpreis.

Audit anfragen