Drei Phasen, ein Werkzeug-Kasten, eine Token-Ökonomie, die über Erfolg oder Geldgrab entscheidet. Hier ist alles, was du brauchst, um dein erstes Produkt selbst zu bauen.
Wir haben keine Partnerschaften mit den hier genannten Anbietern. Wir empfehlen, was wir selbst nutzen.
Setup
Bevor du baust — die sieben Dinge, die du einmal einrichtest.
Erst die Werkzeuge, dann das Konzept. Wir gehen die Reihenfolge durch, in der wir selbst starten — Account, App, Editor, Repo, Regeln, Skills, MCPs. Eine Stunde Setup, dann nie wieder daran denken.
Schritt 01
Claude Pro oder Max Plan
Anthropic-Account mit aktivem Abo ist die Basis. Ein Plan reicht — Pro für den Start, Max wenn du längere Sessions oder mehr Token-Budget brauchst. Ohne aktives Abo kein Cowork und kein Claude Code.
Cowork lebt als dritter Tab innerhalb der Claude Desktop App — du brauchst keine separate App. In Cowork beschreibst du, was dein Produkt können soll, und die KI fragt so lange, bis das Konzept steht. Am Ende fällt eine Markdown-Datei raus, die du in Phase 2 an Claude Code übergibst.
Das Bau-Werkzeug für Phase 2. Zwei Setup-Wege: Terminal (maximal flexibel) oder VS Code (Code, Terminal und Claude in einem Fenster) — Output ist derselbe. Sicherheits-Tipp: bestenfalls auf einem separaten Computer arbeiten, auf dem keine persönlichen Daten liegen. Claude Code bekommt vollen Datei-Zugriff, das sollte sauber getrennt sein.
Backup nach jedem Sprint. API-Keys, interne Notizen und frühe Architektur-Skizzen bleiben unter Verschluss. Vercel und Netlify deployen direkt aus GitHub heraus — der Workflow lohnt sich also doppelt.
In jedem Projektordner liegt eine Datei namens CLAUDE.md. Sie ist das Regelwerk für deine Sessions. Wie du arbeitest, welcher Stack genutzt wird, welche Pflicht-Checks (DSGVO, Performance, Barrierefreiheit) immer laufen, was tabu ist. Claude Code liest sie bei jedem Start automatisch. Ohne CLAUDE.md fängt die KI bei jedem Mal von vorne an.
Skills sind Ordner mit einer Anleitung (Markdown) plus optionalen Skripten. Claude lädt sie nur dann, wenn sie zur aktuellen Aufgabe passen. Vier Skills lohnen sich von Tag 1: UI/UX Design (Komponenten, Layouts, Design-Tokens), Superpowers (Planung, Brainstorming, Test-Driven Development), Code Review (zweiter Blick, bevor du committest) und Memory (CLAUDE.md-Pflege und Lessons-Learned-Tracking über Sessions hinweg).
MCPs (Model Context Protocol) geben Claude Zugriff auf deine Welt — Dateien, GitHub, Datenbank, Browser. Drei für den Start: Filesystem (Claude baut in deinem Projekt), GitHub (Claude wird Team-Mitglied), Context7 (aktuelle Doku statt veralteter Halluzinationen). Brauchst du ein Backend, häng Supabase dran (Datenbank, Auth, Storage). Tipp: am Projekt-Start frag deine Planungs-Session (Cowork oder Superpowers), welche MCPs dein konkreter Use-Case wirklich braucht — sonst sammelst du Zeug, das nichts tut.
bash·Top MCPs anbinden
claude mcp add filesystem -- npx -y @modelcontextprotocol/server-filesystem /pfad/zum/projekt
claude mcp add --transport http github https://api.githubcopilot.com/mcp/ --header "Authorization: Bearer YOUR_GITHUB_PAT"
claude mcp add context7 --transport http https://mcp.context7.com/mcp --header "CONTEXT7_API_KEY: ctx7sk_..."
claude mcp add supabase -- npx -y @supabase/mcp-server-supabase --access-token YOUR_SUPABASE_PAT
Plan-Mode aktivieren. Claude analysiert die Aufgabe und schreibt einen Plan, bevor er codet.
/dream
Brainstorming- und Ideation-Modus. Claude denkt frei laut mit, ohne direkt zu coden.
/init
Projekt einrichten, CLAUDE.md anlegen, Defaults setzen.
/rewind
Zurück zu einem früheren Stand — Checkpoint wiederherstellen.
/plugin
Plugin installieren oder verwalten, MCP-Server hinzufügen.
/usage
Aktuellen Token-Verbrauch checken.
Die drei Modi
Planmodus
Claude recherchiert und schlägt einen Plan vor, bevor Code geschrieben wird. Du liest gegen, sagst „passt“, erst dann legt er los.
Wann nutzt du es: Bei allem, was nicht trivial ist. Standard für jedes neue Feature.
Ausführungsmodus
Claude führt eine bestätigte Aufgabe direkt aus, ohne erneut zu fragen. Schritt für Schritt, mit Sichtbarkeit auf Tool-Calls.
Wann nutzt du es: Wenn der Plan steht und du nur noch das Ergebnis willst.
Automodus
Claude arbeitet autonom durch, fragt nicht zwischendurch. Risikoreicher, aber schneller.
Wann nutzt du es: Bei klaren, kleinen Aufgaben oder wenn du Sprint-Power brauchst.
Die drei Phasen
Vom leeren Bildschirm zur fertigen App. In drei Phasen.
Egal, ob du eine Web-App, eine iOS-App oder eine kleine Automatisierung baust. Der Weg ist immer derselbe. Du planst, du baust, du testest. Wir machen das an unserem eigenen Tool durch, dem KI-Bundestrainer, und du gehst die gleichen drei Schritte für deine Idee.
Phase 01
Planung — du beschreibst, Claude stellt die Fragen
Werkzeug · Claude Cowork
Phase 02
Programmierung — Claude Code baut, du gibst Richtung
Werkzeug · Claude Code
Phase 03
Test & Optimierung — Feintuning am echten Tool
Werkzeug · Browser, Simulator, Logs
Phase 1 · Planung — du beschreibst, Claude stellt die Fragen
Hauptwerkzeug: Claude Cowork.
Du beschreibst, was deine App können soll, und gibst Claude den Auftrag, dich so lange zu fragen, bis das Konzept steht. Am Ende generiert Claude eine Markdown-Datei mit dem fertigen Konzept. Sie ist dein Briefing für die Programmierphase.
Standard-Prompt für Claude Cowork (anpassen und kopieren):
text·Cowork-Briefing
Ich möchte eine [Web-App / iOS-App / Android-App] bauen.
Folgende Funktionen soll sie haben:
[hier Funktionen beschreiben]
Die Zielgruppe ist:
[hier Zielgruppe beschreiben]
Stelle mir so lange Fragen zu Funktionen, Edge-Cases und Zielgruppe, bis du das Konzept vollständig verstanden hast.
Kläre mit mir außerdem die Daten- und Architektur-Seite:
- Welche Daten speichert und verarbeitet die App?
- Welche davon sind kritisch (sensibel, vertraulich, regulatorisch heikel — z. B. Gesundheit, Finanzen, persönliche Notizen)?
- Welche Daten müssen WIR als Betreiber ownen (Server, Datenbank, Backups)?
- Welche Daten sollten ausschließlich dem Nutzer gehören (nur lokal auf dem Gerät, Ende-zu-Ende-verschlüsselt, niemals auf unseren Servern)?
- Welche Software-Architektur passt dazu (reine Frontend-App mit Local Storage, Backend mit Auth + Datenbank, E2E-verschlüsselter Sync …)?
Baue dann eine Markdown-Datei mit dem fertigen Konzept, die ich im nächsten Schritt mit Claude Code teilen kann.
Warum die Daten-Frage so früh?
Du musst heute nicht selbst coden können. Ein Grundverständnis für Software-Architektur lohnt sich trotzdem. Die spannendste Frage dabei ist fast immer: Was passiert eigentlich mit den Daten? Welche landen auf deinen Servern, welche nur auf dem Gerät des Nutzers, welche dürfen den Browser nie verlassen?
Sobald du eine App baust, in der kritische Daten verarbeitet werden (Gesundheit, Finanzen, Tagebuch, Kund:innen-Daten), triffst du diese Architektur-Entscheidung bewusst, bevor die erste Zeile Code geschrieben wird. Genau dafür ist der Datenblock im Prompt oben.
Phase 2 · Programmierung — Claude Code baut, du gibst Richtung
Dein Werkzeug: Claude Code. Details zum Setup, zu Slash-Befehlen und zum Plan-Modus stehen in Sektion B.
Workflow:
1.Lege auf deinem Computer einen Projektordner an.
2.Lege dort die Markdown-Datei aus Phase 1 hinein.
3.Öffne Claude Code in diesem Ordner und schicke ihm den folgenden Prompt.
Standard-Prompt für Claude Code (kopieren und einsetzen):
text·Claude-Code-Briefing
Lies die Markdown-Datei, die ich im Projektordner abgelegt habe.
Baue auf Basis dieses Konzepts die Applikation. Wenn du Fragen hast, stelle sie mir bitte, bevor du anfängst.
Bitte programmiere die App in mehreren Sprints — wir machen immer nur einen klar abgegrenzten Teil auf einmal. Sag mir am Ende jedes Sprints, was du gebaut hast und was als Nächstes ansteht.
Wichtig:
- Plan-Modus vor jeder größeren Änderung. Erst Plan, dann meine Bestätigung, dann Code.
- Sprich Pflicht-Checks aktiv an: DSGVO, Performance, Mehrsprachigkeit, Barrierefreiheit.
- Schlag nach jedem Meilenstein einen Commit-Befehl vor (private Repo auf GitHub).
Phase 3 · Test & Optimierung — Feintuning am echten Tool
Bis hierhin ist es einfach. Du sprichst mit der KI, sagst, was sie tun soll, und die KI erledigt den Rest. Test und Optimierung sind der spannendste Teil. Hier geht es um echte Problemlösung. Funktioniert die UX, auch wenn der Nutzer etwas Unerwartetes tut? Liefert dein Tool die Antworten, die es soll, oder halluziniert das Modell? Wie hoch sind die Token-Kosten pro Aufruf?
Die Details zu Token-Ökonomie, Halluzinationen und Timeouts findest du in Sektion G. Hier nur die typischen Fragen, die in dieser Phase auftauchen:
Funktioniert die UX bei unerwarteten Eingaben?
Liefert das Modell echte Antworten oder erfindet es Inhalte?
Welche Token-Kosten entstehen pro Aufruf?
Brauchst du weitere APIs, um an bessere Daten zu kommen?
Lassen sich Suchergebnisse zwischenspeichern, damit das Endergebnis stabil bleibt?
Skills
Skills — der Trick, der dich aus dem „immer wieder erklären“-Loop holt.
Skills sind Ordner mit einer Anleitung (Markdown) plus optionalen Skripten. Claude lädt sie nur dann, wenn sie zur aktuellen Aufgabe passen. Das hält den Kontext schlank und macht wiederkehrende Aufgaben reproduzierbar.
Abgrenzung in einem Satz:
·Skills sind einzelne, geladene Anweisungen.
·MCPs (Model Context Protocol Server) sind Verbindungen zu Tools — Dateien, GitHub, Datenbank, Browser. Skills sind Anweisungen, MCPs sind Zugriffe. Konfiguration via claude mcp add <name>.
·Plugins sind Bündel aus Skills, Agents, Hooks und MCP-Servern. Installation via /plugin install <name>@<marketplace>.
·Subagents sind eigene Claude-Instanzen mit eigenem Kontext für längere, isolierte Aufgaben (siehe Sektion B5).
Wo Skills liegen: ~/.claude/skills/ (persönlich), .claude/skills/ (projektweit), oder gebündelt im Plugin.
Unsere kuratierte Skill-Auswahl
Pro Karte: Was, Install, Beispiel-Use-Case.
01
claude-code-setup
Was · Analysiert eine bestehende Codebase und empfiehlt passende Hooks, Skills, MCP-Server und Subagents.
Use-Case: Erste Session in einem neuen Repo. Der Skill schlägt dir die richtigen Automatisierungen für deinen Stack vor („du hast Next.js + Supabase → installiere XYZ“).
02
claude-md-management
Was · Pflegt und auditiert die CLAUDE.md-Projekt-Memory, fängt Lessons-Learned aus jeder Session ein.
Use-Case: Du hast zehn Änderungen gemacht und willst sie sauber committen. /commit schreibt Message, staged, committet — alles in einem Schritt.
09
context7
Was · Holt aktuelle, versionsspezifische Doku direkt aus Source-Repos in den Claude-Kontext.
Install
bash
/plugin install context7@claude-plugins-official
Use-Case: „Wie funktioniert der neue Server-Components-Pattern in Next.js 16?“ context7 holt die aktuelle Doku statt zu raten.
10
web-search
Was · Web-Suche aus Claude heraus — recherchiert aktuelle Fakten, prüft Aussagen gegen echte Quellen, gibt Links zurück. Das beste Mittel gegen Halluzinationen bei aktuellen Themen.
Install
bash
/plugin install web-search@anthropic
Use-Case: Aktueller Preis eines Modells, frische Library-Version, ist eine Behauptung wirklich noch wahr? Statt zu raten lässt Claude suchen und zeigt die Quelle.
11
remotion
Was · React-basierte programmatische Videos — du codest Animationen wie eine Komponente, Remotion rendert daraus ein MP4. Gut für Tutorials, Produkt-Demos, Social-Clips.
Install
bash
/plugin install remotion@claude-plugins-community
Use-Case: Onboarding-Video für deine App: Claude baut die Remotion-Komposition mit Text, Bewegung und Sound, du renderst das Endprodukt mit einem Befehl.
12
security-guidance
Was · Hook-basierte Sicherheitswarnungen beim Editieren. Warnt vor Command-Injection, XSS, unsicheren Patterns.
Use-Case: Du tippst zum dritten Mal dieselbe Anweisung („formatier alle Inputs nach unserem Style“). skill-creator macht daraus einen wiederverwendbaren /format-input-Skill.
MCPs — wenn Claude mehr soll als nur Text schreiben.
Irgendwann willst du mehr als Antworten. Du willst, dass Claude deine Dateien anfasst, in deinem GitHub committet, eine Datenbank abfragt, Screenshots im Browser macht. Dafür gibt es MCP — das Model Context Protocol. Ein offener Standard, eine Art einheitlicher Anschluss für KI. Jeder MCP-Server stellt Werkzeuge bereit, die die KI nach deiner Freigabe nutzen darf.
Setup-Grundlage:
·In Claude Code: claude mcp add <name> ... zum Hinzufügen, /mcp zur Verwaltung.
·In Claude Desktop: Ein-Klick-Erweiterungen aus dem Connectors-Menü, ohne Konfigurations-File-Frickelei.
Unsere kuratierte MCP-Auswahl
Pro Karte: Was, Setup-1-Liner, Sicherheits-Hinweis, Link.
01
Filesystem (offiziell)
Was · Geregelter Lese-/Schreibzugriff auf bestimmte lokale Ordner. Die Grundlage für „Claude baut in meinem Projekt“.
Setup
bash
claude mcp add filesystem -- npx -y @modelcontextprotocol/server-filesystem /pfad/zum/projekt
Sicherheit: Nur konkrete Projektordner whitelisten. Nie / oder ~. Keine .env, Keys oder SSH-Ordner einbinden.
Was · Tabellen erstellen und abfragen, Migrationen laufen lassen, Edge Functions und Auth aus Claude heraus.
Setup
bash
claude mcp add --transport http supabase https://mcp.supabase.com/mcp (OAuth-Login im Browser)
Sicherheit: Nie gegen Production verbinden. Supabase empfiehlt explizit Dev-/Staging-Projekte. read_only=true und project_ref setzen. Die häufigste MCP-Katastrophe 2025/26 war jemand, der den MCP an Prod gehängt hat.
Was · Vollzugriff auf Chrome DevTools. Performance-Profiles, Network-Traces, Console-Logs, Lighthouse.
Setup
bash
claude mcp add chrome-devtools --scope user npx chrome-devtools-mcp@latest
Sicherheit: Wenn du an deine normale Chrome-Session andockst, sieht Claude alle eingeloggten Tabs. Für sensible Logins lieber ein Debug-Profil verwenden.
Was · Liest Figma-Files (Components, Variables, Auto-Layout) und gibt Claude den Design-Kontext, um echten Production-Code statt LLM-Mockups zu schreiben.
Setup
bash
claude plugin install figma@claude-plugins-official oder Dev-Mode-MCP in der Figma-Desktop-App aktivieren.
Sicherheit: Nur Dateien teilen, die geteilt werden sollen — OAuth gibt Zugriff auf den ganzen Workspace, wenn du nicht aufpasst.
Was · Stripe-API (Products, Prices, Customers, Subscriptions, Test-Charges) plus Suche in der Stripe-Doku. Pricing, Checkout und Subscriptions aus Claude bauen.
Setup
bash
claude mcp add --transport http stripe https://mcp.stripe.com (OAuth im Stripe-Dashboard)
Sicherheit: Strikt im Test-Mode starten. Live-Keys erst freigeben, wenn die Flows stehen. MCP-Sessions regelmäßig im Stripe-Dashboard auditen.
Was · Notion-Pages und -Databases lesen und schreiben. PRDs, Specs, Knowledge-Base ohne Context-Switch ins Browser-Tab. Claude kann z. B. das aktuelle Spec aus deiner Notion lesen und direkt umsetzen.
Setup
bash
claude mcp add --transport http notion https://mcp.notion.com/mcp (OAuth-Login im Browser)
Sicherheit: OAuth-Scope auf die nötigen Workspaces beschränken. Sensible Datenbanken (HR, Finance) im Setup ausschließen.
Was · Issues, Cycles und Projects abfragen oder erstellen. Roadmap-Sync, Bug-Triage und Task-Updates direkt aus Claude. Gut für Solo-Builds, in denen Issue-Tracking sonst untergeht.
Setup
bash
claude mcp add --transport http linear https://mcp.linear.app/sse (OAuth im Browser)
Sicherheit: Mit Read-only-Scope starten, Schreibrechte erst aktivieren, wenn klar ist, welche Workflows Claude triggern darf.
Was · Web-Suche aus Claude heraus. Komplement zum web-search-Skill: MCP-Variante, die strukturierte Such-Ergebnisse zurückgibt und für Agenten-Workflows besser instrumentierbar ist.
Setup
bash
claude mcp add brave-search -e BRAVE_API_KEY=... -- npx -y @modelcontextprotocol/server-brave-search
Sicherheit: API-Key in einer .env, nicht hardcoden. Free-Tier hat Quota — nicht in Loops nutzen, sonst rate-limit.
Was · OpenAIs Coding-Agent als MCP-Server. Claude kann Codex aus dem Editor heraus aufrufen, um den eigenen Code von einem zweiten Modell reviewen zu lassen — Cross-Model-Second-Opinions decken oft blinde Flecken auf, die ein Modell im Selbstgespräch übersieht.
Setup
bash
claude mcp add codex -- npx -y @openai/codex-mcp
Sicherheit: OpenAI-API-Key in .env, nicht hardcoden. Code-Reviews sind Read-only-Operationen, aber der Key kostet pro Call — bei Loops oder großen Diffs vorher Quota checken.
Sie geben dem Agent eine ungebremste Shell. In Kombination mit prompt-injiziertem Input aus Web, GitHub-Issues oder Mails extrem riskant. Wenn überhaupt: in einer isolierten VM, niemals auf dem Hauptsystem.
Warnung 2
Universal-API-MCPs.
Generic REST-Wrapper, die beliebige HTTP-Calls erlauben. Klingen praktisch, sind genau das Muster, das beim Supabase-Demo-Leak 2025 zum Datenabfluss führte.
Warnung 3
Supabase gegen Production.
Selbst der offizielle MCP ist gefährlich, wenn du ihn an die Live-Prod-DB hängst. Dev-Projekt, read_only=true, project_ref auf Dev.
Allgemeine Regel:
Kein MCP installieren, ohne 30 Sekunden über den Blast-Radius nachzudenken. Wenn ein bösartiger String aus einer Webseite oder einem Issue ungefiltert in den Agenten kommt — was kann der MCP im Worst Case tun?
Vibe-Coding-Tools
Warum nicht einfach Lovable, Bolt oder v0?
Weil es unnötig viel Token-Geld kostet. Vibe-Coding-Builder bringen dich auf 70 Prozent — die letzten 30 Prozent (Auth-Flows, Custom-Logik, Security) zahlst du in Credit-Loops, die schnell explodieren. Mit Claude Code geht es günstiger, und es gibt trotzdem gute Produkte da draußen.
Die Tool-Karten — Lovable, Bolt, v0, Rork, Replit, Cursor, Figma Make — haben wir auf der Tools-Seite kuratiert, samt Pricing, Stärken und Bruchstellen. Da gehört das hin.
Die Frage, die über Leben und Tod deines Produkts entscheidet.
Günstig zu bauen ist das eine. Das Tool dauerhaft zu betreiben, ohne von der Rechnung erschlagen zu werden, ist das andere. Token sind die operativen Kosten deiner KI-App. Wer Modelle, Caching und Pre-Computation nicht im Griff hat, wird beim ersten viralen Tag zum Geldgrab.
Case · KI-Bundestrainer
Hochrechnung: 100.000 Nutzer × 2 Generierungen × 16.000 Tokens auf einem Premium-Reasoning-Modell. Ergebnis: rund 156.000 USD pro Tag. Nach den vier Hebeln unten waren wir bei rund 65 USD pro Tag. Eine Reduktion um −99,96 Prozent.
Die vier Hebel auf einen Blick
Von 156.000 USD/Tag auf rund 65 USD/Tag. Die vier Hebel im Effekt aufeinander gestapelt:
Hebel
Was passiert
Effekt
1 · Modellwahl
Wechsel von Opus 4 auf GPT-4o-mini
−95 % Modell-Kosten
2 · Pre-Computation
Daten einmal recherchieren, in DB ablegen
−98 % Web-Search
3 · Caching
Wiederholungen aus dem Cache statt neu rechnen
≈ −65 % Anfragen
4 · Max-Tokens-Cap
Hartes Limit auf Output-Länge
−30 % Latenz
Vorab · Was du beim Bauen selbst tun kannst
Token-Optimierung beginnt nicht erst beim Modell-Pricing, sondern bei deiner Arbeitsweise mit Claude Code. Drei Hebel, die sofort wirken, bevor du eine Zeile Modell-Logik anfasst:
1/clear und /compact regelmäßig nutzen. Nach jeder fertigen Aufgabe einmal /clear (Context-Reset) oder /compact (Zusammenfassung). Hält den Kontext schlank und macht Claude deutlich präziser und günstiger.
2In Sprints mit kleinen Arbeitspaketen denken. Statt einer Mega-Session über Stunden lieber klar abgegrenzte Pakete: ein Feature, eine Komponente, ein Bugfix. Weniger Token pro Session, klarerer Fokus, weniger Sackgassen.
3Pro Aufgabe neue Session. Sobald die nächste Aufgabe nichts mit der vorherigen zu tun hat, starte frisch. Claude muss nicht 200 alte Nachrichten lesen, um zu verstehen, was du als nächstes willst.
Hebel 1 · Modellwahl
Premium-Reasoning-Modelle (Claude Opus, GPT-4) sind für die meisten Use-Cases zu viel, wenn du strukturierte Entscheidungen aus einem vordefinierten Pool triffst. Wechsle auf Stats-optimierte Klassen (GPT-4o-mini, Claude Haiku 4.5) und du zahlst Sub-Cent pro Call statt mehrerer Cent.
Modell-Tabelle (Pricing-Bars relativ zu Opus 4 = 100 %):
Modell
Input · 1M Tok
Output · 1M Tok
Output relativ
Einordnung
Claude Opus 4
15 USD
75 USD
100 %
Top-Qualität, für strukturierte Picks oft zu teuer
GPT-4 (Classic)
30 USD
60 USD
80 %
Overkill, wenn du nur aus einem Pool wählst
Claude Haiku 4.5Unsere Wahl
1 USD
5 USD
7 %
Unsere Wahl für Texte mit Tonalität — bester Sprachton bei Sub-Cent
OpenAI GPT-4o-miniUnsere Wahl
0,15 USD
0,60 USD
0,8 %
Unsere Wahl für strukturierte Aufgaben — JSON, Klassifikation, Picks
DeepSeek V3
0,27 USD
1,10 USD
2 %
Deutsche Generierung: schwach, vor allem in Stil-/Satire-Tonarten
Qwen 2.5 72B
0,35 USD
0,40 USD
0,6 %
Deutsche Generierung: schwach in nicht-neutralen Tonarten
Gemini 2.0 Flash
0,10 USD
0,40 USD
0,5 %
Sehr günstig, aber Schema-Fails bei strikten JSON-Requirements
Listenpreise gerundet. Chinesische Modelle sind nominal günstig, aber bei deutscher Sprachgenerierung in bestimmten Tonarten (z. B. Satire) unbrauchbar. Die Wortwahl kippt schnell ins Generische.
Praxis-Tipp: Modelle parallel einsetzen. Beim KI-Bundestrainer nutzen wir Anthropic für Texte mit Stilgefühl (Satire, Stellungnahmen) und OpenAI für strukturierte Aufgaben (Kader-Auswahl). Das spart Geld und liefert für jeden Use-Case das passende Werkzeug.
Hebel 2
Pre-Computation — einmal recherchieren, oft wiederverwenden
Daten, die sich selten ändern, recherchierst du einmal und legst sie in einer Datenbank ab. Die KI greift beim Generieren nur noch darauf zu, statt bei jedem Call erneut zu suchen. Live-Daten holst du in größeren Intervallen (z. B. einmal pro Tag), nicht pro User-Anfrage.
Beispiel: Beim KI-Bundestrainer haben wir die 108 Kandidaten einmal recherchiert. Aktuelle Form, Verletzungen und Gegner-Analyse holen wir einmal pro WM-Spiel.
Effekt · −98 Prozent Web-Search-Kosten.
Hebel 3
Caching — gleiche Frage, gleiche Antwort
Wenn zwei User dasselbe anfragen, soll die KI nicht zweimal rechnen. Speichere bei jeder Anfrage die Eingaben plus das Ergebnis. Bei einer Wiederholung lieferst du das Ergebnis aus dem Cache, statt die KI erneut zu starten.
Effekt · Rund 65 Prozent der Anfragen entfallen komplett, je nach Anwendungsfall sogar mehr.
Bonus: Prompt-Caching beim Provider
Prompt-Caching beim Provider. Sowohl Anthropic als auch OpenAI cachen wiederkehrende Prompt-Teile (System-Prompts, feste Anleitungen) automatisch. Cache-Treffer kosten bei Anthropic etwa ein Zehntel des normalen Input-Preises — bis zu 90 Prozent Ersparnis. Bau deinen Prompt so, dass der stabile Teil nach vorne kommt und der variable User-Input nach hinten.
Hebel 4
Max-Tokens cappen
Modelle dürfen oft „bis zu 16.000 Output-Tokens“ und nutzen das gerne als Freifahrtsschein zum Nachdenken, selbst wenn der Output deutlich kürzer wäre. Setze ein hartes Cap (z. B. 7.000). Das Modell interpretiert das als Budget-Signal und kürzt automatisch. Kein Qualitätsverlust, weil das echte Output-Volumen meist drunter liegt.
Effekt · −30 Prozent Latenz, nebenbei weniger Timeouts.
Vier Konzepte, die du nicht von Tag 1 brauchst, die dein Setup aber schärfer machen, sobald du regelmäßig baust.
Plugins
Plugins bündeln Skills, Subagents, Hooks und MCP-Server in einem Paket. Installation über /plugin install [name]@[marketplace]. Marketplaces sind Repos auf GitHub, die du als Quelle hinzufügst. So holst du dir komplette Workflows mit einem Befehl.
Hooks
Hooks sind kleine Automatiken, die bei bestimmten Ereignissen feuern — vor oder nach einem Tool-Aufruf, vor einem Commit, beim Edit einer Datei. Damit erzwingst du Verhalten, das du sonst manuell triggern müsstest („vor jedem Commit die Tests laufen lassen“, „beim Editieren einer Auth-Datei eine Security-Warnung zeigen“).
Permissions
Permissions legen fest, was Claude ohne Rückfrage darf und was nicht. Drei Stufen: erlauben, fragen, verbieten. Wichtig, sobald die KI selbstständig läuft (Auto-Mode, Subagents, Hooks). Defaults sind sicher, aber du kannst sie pro Projekt schärfen — etwa Filesystem-Writes nur in bestimmten Ordnern, keine Shell-Befehle ohne Bestätigung.
Agent SDK
Das Agent SDK ist der Weg, Claude direkt in dein fertiges Produkt einzubauen. Aus dem Konsolen-Tool wird ein Agent, der in deiner App lebt. Du baust eigene Werkzeuge, definierst System-Prompts, gibst dem Agenten Zugriff auf deine Datenbank — und Endnutzer reden mit Claude über deine Oberfläche statt über die Konsole.
Deine Bauen-Challenge
Loslegen schlägt Lesen.
Nur wenn du KI selbst nutzt, verstehst du, wie sie funktioniert. Ein kleines Tool, ein Wochenend-Experiment, ein internes Skript. Egal. Du musst kein Techie werden. Du musst nur einmal angefangen haben.
Bau dein erstes KI-Tool
Wähle eine Form: Web-App, iOS-App, kleine Automatisierung oder Workflow. Geh durch die drei Phasen aus Sektion A — Planung mit Claude Cowork, Programmierung mit Claude Code, Test im Browser oder Simulator. Plane ein Wochenende ein. Du wirst überrascht sein, wie weit du kommst.