Vor ungefähr 6 Monaten haben wir bei Flavored Media unser Telefon umgestellt. Statt einer Mailbox, die nie jemand abhört, oder einem Callcenter-Vertrag, den niemand wirklich will, läuft jetzt ein Voice-Agent. Er nimmt Anrufe entgegen, wenn niemand erreichbar ist, qualifiziert das Anliegen und vereinbart Rückruftermine.

Hier sind die echten Zahlen. Inklusive der Posten, die uns überrascht haben.

Setup-Phase: 2 Wochen, ungefähr 80 Stunden

Wir haben den Bot komplett selbst gebaut, weil wir Voice-Anbieter wie Voiceflow oder Synthflow getestet hatten und keiner uns die nötige Flexibilität gegeben hat (besonders bei deutscher Sprache und Anschluss an unseren Kalender).

Was die 80 Stunden wirklich gekostet haben:

  • Twilio-Setup, Rufnummer-Portierung, Telefonie-Routing: 12h
  • OpenAI Realtime API-Integration, erste Prompts, Tests: 20h
  • Google-Kalender-Anbindung, Mail-Notification, Datenbank-Schicht: 16h
  • Edge-Cases (Hintergrundgeräusche, schlechte Verbindung, schwerer Dialekt): 24h
  • Live-Tests mit echten Anrufern aus dem Bekanntenkreis: 8h

Wenn wir das als Beratungsleistung kalkulieren würden, wären das bei unserem Stundensatz rund 12.000 Euro Setup-Kosten. Da wir uns selbst beratschlagt haben, kostet es uns auf dem Papier nichts — in Wirklichkeit aber natürlich die Opportunitätskosten von zwei Wochen.

Laufende Kosten pro Monat

Das ist der Teil, der die meisten überrascht. Es ist nicht nur die OpenAI-Rechnung.

  • Twilio (Telefonie + SIP-Trunk): 32 Euro Grundgebühr + ungefähr 18 Euro Gesprächsminuten
  • OpenAI Realtime API: 140 Euro im durchschnittlichen Monat (bei aktuell ~80 Anrufen, davon 40 die wirklich mit dem Bot sprechen)
  • Hetzner Server (n8n + Logging): 18 Euro (anteilig, der Server läuft eh)
  • SMS-Bestätigungen über Twilio: 4 Euro
  • Domain, SSL, Monitoring: 6 Euro

Macht in Summe ungefähr 218 Euro pro Monat. Plus die Wartungszeit, die wir reinstecken — durchschnittlich 4 Stunden im Monat für Prompt-Optimierung, Bug-Fixing, OpenAI-Modell-Updates.

Was es ersetzt hat

Wir hatten kein klassisches Callcenter. Wir hatten vorher: Mailbox + manuelles Rückrufen. Das hat ungefähr so funktioniert, dass von 10 Mailbox-Anrufen 3 zurückgerufen wurden, davon 1 zu einem Auftrag wurde.

Mit dem Bot werden jetzt 9 von 10 Anrufen direkt entgegengenommen. Davon entstehen ungefähr 3 qualifizierte Rückrufbitten pro Woche, von denen 1-2 zu einem Auftrag werden. Heißt: ungefähr doppelt so viele Aufträge aus Telefonanrufen bei gleichem manuellen Aufwand.

Wenn wir das in Geld übersetzen — Durchschnitts-Auftragswert mal Zusatz-Aufträge — sind das ungefähr 1.500-2.500 Euro Mehrumsatz pro Monat. Bei 218 Euro Kosten plus 4 Stunden Wartung ist das ein einfacher Business Case.

Was in keinem LinkedIn-Post steht

Trade-Off 1: Die ersten 6 Wochen waren peinlich

Der Bot hat in der Lernphase Sachen gemacht, die uns geärgert haben. Er hat einmal einem Anrufer dreimal die gleiche Frage gestellt, weil er die Antwort nicht parsen konnte. Er hat einer Kundin einen Termin um 25 Uhr angeboten (Bug in der Zeitzonen-Logik). Er hat einmal mitten im Satz aufgelegt, weil ein Timeout zugeschlagen hat.

Jeder dieser Fälle war ein Notfall-Fix-Abend. Wer keinen Stomach für solche Phasen hat, sollte einen Voice-Bot nicht selbst betreiben.

Trade-Off 2: Bestimmte Kunden hassen es

Wir haben in den ersten Wochen ungefähr 5 Beschwerden bekommen, von Anrufern, die sich geweigert haben, mit einem Bot zu sprechen. Die meisten haben dann den Bot bedient und waren am Ende okay damit. Einer hat aufgelegt und nie wieder angerufen.

Wir haben das gelöst, indem der Bot in den ersten 5 Sekunden klar sagt: "Hallo, ich bin ein KI-Assistent von Flavored Media. Wenn Sie lieber mit einem Menschen sprechen wollen, sagen Sie 'Mensch' und ich verbinde Sie." Das hat die Beschwerden auf praktisch null reduziert.

Trade-Off 3: Du wirst zum Voice-API-Experten, ob du willst oder nicht

OpenAI hat in den 6 Monaten die Realtime-API dreimal substanziell geändert. Einmal hat sich das Streaming-Format geändert (4 Stunden Refactoring). Einmal wurden bestimmte Voices deprecated (2 Stunden Migration). Einmal sind die Preise um 35% gestiegen (kein Refactoring, aber unangenehme Mail an die Buchhaltung).

Wenn ihr ein Voice-System betreibt, braucht ihr jemanden, der diese Änderungen mitnimmt. Sonst funktioniert es eines Morgens nicht mehr und niemand weiß warum.

Wann es sich lohnt — und wann nicht

Lohnt sich

  • Wenn ihr regelmäßig Anrufe verpasst und das spürbar Umsatz kostet
  • Wenn die meisten Anrufe nach einem Muster ablaufen (Erstkontakt, Terminvereinbarung, Bestellannahme)
  • Wenn ihr jemanden im Team habt, der die Technik versteht und Anpassungen machen kann

Lohnt sich nicht

  • Wenn die Anrufe sehr komplex und individuell sind (Beratung, Schadenmeldung, sensible Themen)
  • Wenn ihr ein hochpreisiges Premium-Segment bedient, wo "menschlicher Service" Teil des Versprechens ist
  • Wenn niemand bei euch Zeit oder Know-How hat, das System zu betreuen

Bottom Line: 218 Euro Monatskosten, 4 Stunden Wartung, ~1.500-2.500 Euro Mehrumsatz. Lohnt sich für uns deutlich. Würde sich auch für viele KMU lohnen — wenn die Erwartungshaltung stimmt: das Ding läuft nicht von selbst, und es ist nicht über Nacht fertig.

Voice-Agent für euer Unternehmen?

Im Build-Workshop bauen wir mit euch das erste lauffähige System. Ihr lernt mit, betreibt es danach selbst — wir bleiben für Updates und Fragen erreichbar.

Workshop anfragen