inzpyre.me
KI lernenTools

05 · Build-Beweis

Beispiele.

KI-Disruptions-Score, KI-Bundestrainer, Dopafy, und mehr. Was wir selbst gebaut haben, und wie es entstand.

Statt nur zu erklären, zeigen wir, was dabei rauskommt.

Drei Case-Studies · Lesezeit ca. 6–10 Minuten · Stand Mai 2026

01 · Case-Study

KI-Disruptions-Score

Ein Web-Tool. Du gibst dein LinkedIn-Profil rein, die KI sagt dir schonungslos ehrlich, wie disruptierbar dein Job in den nächsten Jahren ist. Plus: welche Skills relevant werden und was du heute lernen solltest.

Bild-Story

KI-Disruptions-Score Screenshot 1
KI-Disruptions-Score Screenshot 2

Wie es entstand

Inspiriert von Anthropics deathbyclaude.ai — das Tool bewertet, wann Geschäftsmodelle und ganze Unternehmen von KI disruptiert werden. Wir haben das Prinzip aufs Individuum gedreht: nicht das Business, sondern dein Job. Der Score soll greifbar machen, dass die KI-Revolution real ist und Positionierung jetzt heißt: lernen, mit KI zu arbeiten. Konkret: selbst Produkte bauen.

Der Kniff

LinkedIn-Profil rein → Claude liest Skills, Branche und Karrierephase → schonungslos ehrliches Urteil plus konkrete Skill-Empfehlungen für genau diese Person. Kein generischer Test, sondern personalisierte Analyse mit empfohlenen Lern-Schritten.

Tech-Stack

Frontend
Next.js + React (mit Claude Code gebaut)
Backend
LinkedIn-API via RapidAPI
KI
Anthropic (Claude)
Hosting
Vercel

Was wir gelernt haben

  • Bei viralen Tools entscheidet die erste Sekunde. Wir hatten überlegt, Beruf, Branche und Aufgaben einzeln abzufragen — sauberer für die KI, schlechter für die Conversion. Die finale Variante: LinkedIn-URL rein, fertig. Die KI scrapt den Rest. Wer länger als 10 Sekunden tippen muss, springt ab. Lieber etwas schlechtere Datenbasis als gar keine Nutzer.
  • Wenn das Tool selbst kein Geld bringt, muss es einen anderen Hebel haben. Bei uns: jeder, der seinen Score sieht, kann sich die Detail-Analyse als PDF zusenden lassen — gegen Newsletter-Anmeldung. So wird aus einem viralen Gimmick eine echte Lead-Maschine. Wichtig: die PDF muss wirklich Mehrwert liefern, sonst trägt der Lead sich sofort wieder aus.
  • Newsletter-Einträge nur mit Double-Opt-In, sonst Abmahnung. Nach der Eingabe der Mail bekommst du eine Bestätigungs-Mail mit Link. Erst nach Klick auf den Link landest du in der aktiven Liste. Vorher wird die Adresse mit einem temporären Token gespeichert und nach Frist automatisch gelöscht, wenn keine Bestätigung kommt. Klingt nach Friction, ist aber Pflicht und filtert obendrein Bots raus.

02 · Case-Study

KI-Bundestrainer

Ein virales Web-Tool zur WM 2026. Die KI stellt die deutsche Nationalmannschaft auf, in acht Trainer-Personas, und schreibt die Kritik gleich mit. Powered by inzpyre.me.

Bild-Story

KI-Bundestrainer Screenshot 1
KI-Bundestrainer Screenshot 2
KI-Bundestrainer Screenshot 3

Wie es entstand

Spaßprojekt zur WM 2026. Alex ist vor Ort, und mit KI kann man von überall auf der Welt bauen, also wurde aus der Reisevorbereitung ein Side-Tool. Eingebaute Features wie Turnierbaum und Spielwahrscheinlichkeiten (gegen wen spielen wir wann, wie wahrscheinlich kommen wir weiter) haben Alex bei der eigenen Reiseplanung geholfen. Der eigentliche Zweck: an einem greifbaren Beispiel zeigen, wie einfach man heute mit KI Produkte baut und welche Herausforderungen real begegnen.

Der Kniff

Zwei Kniffe parallel: (1) Zwei KI-Anbieter parallel — Anthropic für Texte mit Stilgefühl (Satire, Trainer-Stellungnahmen), OpenAI für strukturierte Aufgaben (Kader-Auswahl). Jeder Anbieter macht das, worin er stark ist. (2) Acht Trainer-Personas mit eigenem Sprachprofil — typische Phrasen, Satzbau, Negativ-Heuristik („das würde diese Person nie sagen“). Dadurch klingt der Output konsistent in der Persona, obwohl darunter ein Budget-Modell rechnet.

[Alex liefert: Was macht den Output teilbar genug, dass Leute ihn posten? Welche Persona ist die unterhaltsamste?]

Tech-Stack

Frontend
Next.js + React
Backend
Supabase + API-Routes mit Caching-Schicht
KI
Anthropic (Claude Haiku 4.5) + OpenAI (GPT-4o-mini)
Hosting
Vercel + Cloudflare

Was wir gelernt haben

  • Token-Ökonomie entscheidet über Leben und Tod. Hochrechnung 100.000 Nutzer × 2 Generierungen × 16.000 Tokens auf einem Premium-Reasoning-Modell wären rund 156.000 USD/Tag gewesen. Mit den vier Hebeln (siehe Deep-Dive unten) waren wir bei rund 65 USD/Tag — Reduktion um −99,96 %.
  • Günstiges Modell + ausführliches Sprachprofil schlägt teures Modell ohne Profil. Claude Haiku 4.5 mit detailliertem Persona-Profil im System-Prompt klingt nach Trainer-Persona, obwohl es ein Sub-Cent-Modell ist.
  • Caching wird billiger, je viraler das Tool wird. Wenn zwei User dasselbe anfragen (gleicher Tag, gleicher Gegner, gleiche Persona), liefert der Cache das Ergebnis. Bei Viralität fallen rund 65 % der Anfragen weg.

Ausgangslage

Hochrechnung: 100.000 Nutzer × 2 Generierungen × 16.000 Tokens auf einem Premium-Reasoning-Modell = rund 156.000 USD pro Tag. Nach den vier Hebeln: rund 65 USD/Tag. Reduktion: −99,96 %.

Hebel 1

Modellwahl

Premium-Reasoning-Modelle (Claude Opus, GPT-4 Classic) sind für die meisten Use-Cases Overkill, wenn du strukturierte Entscheidungen aus einem vordefinierten Pool triffst. Wir sind auf Stats-optimierte Klassen gewechselt — Sub-Cent pro Call statt mehrerer Cent.

Claude Opus 4

In · 15 $Out · 75 $

Zu teuer für unseren Use-Case

GPT-4 Classic

In · 30 $Out · 60 $

Overkill für strukturierte Picks

Claude Haiku 4.5

Unsere Wahl
In · 1 $Out · 5 $

Trainer-Texte (Sprachton, Satire)

OpenAI GPT-4o-mini

Unsere Wahl
In · 0,15 $Out · 0,60 $

Kader-Auswahl (strukturiert)

Gemini 2.0 Flash

In · 0,10 $Out · 0,40 $

Günstig, aber Schema-Fails

Qwen 2.5 72B

In · 0,35 $Out · 0,40 $

Deutsche Generierung: schwach

DeepSeek V3

In · 0,27 $Out · 1,10 $

Deutsche Generierung: schwach

Listenpreise gerundet. Chinesische Modelle sind nominal günstig, aber bei deutscher Sprachgenerierung in bestimmten Tonarten (z. B. Satire) leider unbrauchbar — die Wortwahl kippt schnell ins Generische.

Hebel 2

Pre-Computation

Daten, die sich selten ändern, recherchierst du einmal und legst sie in einer Datenbank ab. Die KI greift beim Generieren nur noch darauf zu, anstatt bei jedem Call erneut zu suchen. Live-Daten holst du in größeren Intervallen (z. B. einmal pro Tag oder einmal pro Spiel), nicht pro User-Anfrage.

Konkret beim Bundestrainer: Die 108 Kandidaten wurden einmal recherchiert. Aktuelle Form, Verletzungen und Gegner-Analyse werden einmal pro WM-Spiel geholt, nicht pro User.

Effekt · −98 % Web-Search-Kosten

Hebel 3

Caching

Wenn zwei User dasselbe anfragen (gleicher Spieltag, gleicher Gegner, gleiche Persona), rechnet die KI nicht zweimal. Wir speichern bei jeder Anfrage die Eingaben plus das Ergebnis. Bei einer Wiederholung kommt das Ergebnis aus dem Cache.

Je größer der Ansturm, desto mehr greift der Cache. Viralität wird billiger statt teurer.

Effekt · ≈ −65 % der Anfragen entfallen komplett

Hebel 4

Max-Tokens cappen

Modelle dürfen oft „bis zu 16.000 Output-Tokens“ — und nutzen das als Freifahrtsschein zum Nachdenken, selbst wenn der Output deutlich kürzer wäre. Wir setzen ein hartes Cap (z. B. 7.000). Das Modell interpretiert das als Budget-Signal und kürzt automatisch. Kein Qualitätsverlust, weil das echte Output-Volumen meist drunter liegt.

Effekt · −30 % Latenz — und nebenbei weniger Timeouts

Cross-Verweis

Wer die generelle Mechanik dahinter verstehen will, findet sie als eigene Station in „Bauen mit KI“.

Sektion G · Token und Kosten sparen
Challenge 1

Halluzinationen-Verteidigung (vier Schritte)

Günstige Modelle erfinden gern Eigennamen, Faktenlisten oder Domänen-spezifische Begriffe. Beim Bundestrainer wäre ein erfundener Nationalspieler peinlich. Vier Schritte, die wir gegen Halluzinationen einsetzen:

  1. 01Datenbestand einmal sauber recherchieren und in einer Datenbank hinterlegen. Daraus wird ausgewählt, fertig.
  2. 02Klare Regeln im System-Prompt: „Nur X. Nicht Y, auch wenn Y so ähnlich klingt.“
  3. 03Bei zu wenig Treffern: lieber aus der Reserve picken als halluzinieren lassen.
  4. 04Server-seitiger Validierungs-Check: Was nicht in der Liste ist, wird automatisch verworfen.
Challenge 2

Timeouts-Fix

Wenn die KI zu lange rechnet, bricht der Hoster (oft nach 60 Sekunden) ab — der User sieht keine Antwort, sondern eine Fehlermeldung. Drei Hebel haben uns geholfen:

  • Max-Tokens-Cap (siehe Hebel 4)
  • Eingabe-Daten entschlacken (weniger Input, weniger Lesearbeit)
  • Modell wechseln zu einem, das strukturierte Antworten schneller liefert
Challenge 3

Sprachstil trotz günstigem Modell

Günstige Modelle können Fakten, klingen aber oft generisch. Wenn dein Tool eine spezifische Stimme braucht (Trainer-Persona, Markenton, Satire), kriegt das kein Budget-Modell von alleine hin. Der Fix: ein ausführliches Sprachprofil — typische Phrasen, Satzbau, Negativ-Heuristik („das würde diese Person nie sagen“). Wandert bei jedem Call in den System-Prompt. Trotz Budget-Modell bleibt der Ton dann erstaunlich nah am Original.

03 · Case-Study

Dopafy

Eine App, die dir hilft, deinen Dopaminhaushalt zu managen und Routinen aufzubauen — für ein höheres Energielevel und gesteigerte Konzentrationsfähigkeit. Damit du deine Ziele erreichst.

In EntwicklungLive-Link

Bild-Story

Dopafy Screenshot 1
Dopafy Screenshot 2
Dopafy Screenshot 3
Dopafy Screenshot 4
Dopafy Screenshot 5
Dopafy Screenshot 6
Dopafy Screenshot 7
Dopafy Screenshot 8

Wie es entstand

Alex hat 2025 sieben Wochen lang auf jegliche künstlichen Dopamin-Quellen verzichtet: Social Media, Zucker, Alkohol, Streaming, Fast Food, Pornografie, Drogen. Ergebnis: deutlich mehr Energie, klarer Kopf, fokussiertes Arbeiten. Danach hat er sich tiefer mit dem Thema beschäftigt und einen Dopamin-Schedule entwickelt, der Routinen und Reize sinnvoll taktet. Genau dieser Schedule und die Erkenntnisse stecken jetzt in Dopafy.

Der Kniff

Drei Kernfunktionen, die Wissenschaft in den Alltag übersetzen: personalisierter Routinenplan, Statistiken und Analyse mit KI-Empfehlungen, Bildschirmzeit-Tracking mit Screen-Blocking.

Tech-Stack

Frontend
SwiftUI (native iOS) · Xcode

Was wir gelernt haben

  • Datenschutz als Architektur-Entscheidung, nicht als Disclaimer-Häkchen. Dopafy fragt dich nach Dingen, die niemand sonst sehen sollte: wie oft du zu viel Social Media, schlechte Ernährung, Rauchen, Vapen, Alkohol, Drogen oder Pornografie konsumierst. Ein Datenleck kostet Vertrauen und ist unter DSGVO direkt strafbar. Die Schlüsselfrage war: Wie viel Daten brauchen wir wirklich, um Menschen beim Dopamin-Management zu helfen? Viel weniger als gedacht. Alle sensiblen Einträge bleiben on-device auf dem iPhone, in den verschlüsselten Apple-Containern. Auf unseren Servern liegt nur Unkritisches: Routinen-Templates, anonyme App-Nutzung. Für KI-Empfehlungen entscheidest du per Toggle: Bei Ja gehen die Daten anonymisiert an Claude von Anthropic, kommen als Insights zurück, wir behalten sie nicht. So gehört dir deine Geschichte, und wir liefern nur die Software drumherum.
  • Apple-Freigaben für Extension-Targets brauchen Zeit, manchmal auch einen Anruf. Dopafy nutzt System-Features wie Screen-Time-Auswertung und App-Blocking. Jedes davon ist ein eigenes Extension-Target im Xcode-Projekt und braucht eine eigene Apple-Freigabe, zusätzlich zur App-Freigabe selbst. Wir hatten die App-Freigabe und beantragten die Extension-Freigaben nach. Apples Standard-Antwort kam jedes Mal zurück, wir hätten die Freigaben schon — der Workflow erkannte den Unterschied zwischen App-Level und Extension-Level nicht. Nach mehreren Runden im Kreis bin ich auf den Apple Support zugegangen und habe das als Workflow-Bug beschrieben. Apple hat den Fehler bestätigt und den Prozess angepasst. Lesson: Mit Apple offen kommunizieren, sie helfen wirklich. Und plane Puffer ein, solche Freigaben können Wochen dauern.

04 · Case-Study

Social-Media-Reels-Workflow

Ein n8n-Workflow, der aus einem One-Pager ein fertiges Reel-Video für Instagram, TikTok und LinkedIn generiert. Vollständig in n8n, generiert über Claude Code, läuft auf Hetzner.

Live

Bild-Story

Social-Media-Reels-Workflow Screenshot 1

Wie es entstand

Wir wollten zeigen, wie ein produktiver KI-Automation-Workflow konkret aussieht. Nicht nur Theorie über n8n und MCPs, sondern ein laufendes Beispiel mit echten Posting-Targets. Der One-Pager-Input ist universell: jede Kampagne, jeder Launch lässt sich so wiederverwerten — Briefing einmal schreiben, drei Kanäle automatisch bespielen.

Der Kniff

Workflow als Prosa beschreiben, Claude Code generiert das n8n-JSON über den n8n-MCP und importiert es direkt in die laufende Instanz. Statt 40 Knoten manuell zu klicken, schreibst du das Briefing in Markdown — der Rest passiert automatisch. Self-Hosted auf Hetzner für rund 5 €/Monat, voller Datenschutz, kein Lock-in.

Tech-Stack

Bau
Claude Code + n8n-MCP
Frontend
n8n self-hosted
Backend
Postgres + Caddy
KI
Anthropic + OpenAI
Hosting
Hetzner CX22

Was wir gelernt haben

  • Workflow als Prosa, nicht als Drag-and-Drop. Beschreibung in Markdown — Claude Code generiert das n8n-JSON über den MCP. Statt 40 Knoten manuell zu ziehen, schreibst du das Briefing in einem Absatz. Iterationen werden zu Edits in der Markdown-Datei, nicht zu Klick-Sessions im Editor.
  • Self-Hosting lohnt sich ab dem ersten produktiven Workflow. Hetzner CX22 für rund 5 €/Monat statt 24 € n8n-Cloud-Starter. Voller Datenschutz, kein Lock-in, mehr Executions. Setup einmalig in einem Nachmittag, dann läuft es.
  • MCP-Brücke macht Workflows iterierbar wie Code. Claude Code liest den n8n-Stand, modifiziert das JSON, importiert die neue Version. Diffbar, branchbar, reviewbar im Git. Workflows verhalten sich plötzlich wie richtige Software.

Was du daraus mitnimmst

Drei Apps, drei verschiedene Stacks, ein gemeinsamer Nenner: Sie sind alle mit Claude Cowork geplant und mit Claude Code gebaut. Wenn du Lust hast, das selber anzupacken, ist der nächste Schritt nicht „Schau dir noch fünf Tutorials an“. Der nächste Schritt ist: anfangen.

Weiter zur nächsten Station

Tools

Was wir wirklich nutzen. Kuratiert in 8 Kategorien, mit Pricing und EU-Hinweisen.

Reinschauen