Prompt Engineering
Ein guter Prompt beschreibt Aufgabe, Kontext, Grenzen und Ausgabe so konkret, dass ein anderer Entwickler ihn testen könnte.
Inhaltsverzeichnis
- Überblick
- Grundlegende Prompt-Strukturen
- Zero-Shot, Few-Shot und Reasoning
- System-Prompts für Agenten
- Tool-Beschreibungen optimieren
- Ausgabeformatierung
- Fortgeschrittene Strategien
- Best Practices
- Häufige Fehler und Lösungen
- Zusammenfassung
- Ergänzende Ressourcen
- Abgrenzung zu verwandten Dokumenten
Überblick
Ein Prompt ist die Schnittstelle zwischen Aufgabe, Kontext und Sprachmodell. Die Qualität der Antwort hängt nicht nur davon ab, was gefragt wird, sondern auch davon, welche Informationen, Beispiele, Grenzen und Ausgabeformate das Modell erhält.
Für KI-Agenten ist Prompt Engineering besonders relevant, weil Prompts nicht nur Antworten formulieren lassen, sondern Verhalten steuern:
| Kontext | Bedeutung |
|---|---|
| System-Prompts | Definieren Rolle, Fähigkeiten und Grenzen des Agenten |
| Tool-Beschreibungen | Bestimmen, wann und wie ein Agent Werkzeuge einsetzt |
| Reasoning-Prompts | Steuern den Denkprozess bei komplexen Aufgaben |
| Output-Formatierung | Garantieren strukturierte, verarbeitbare Antworten |
Kernprinzip: Ein gut formulierter Prompt reduziert Interpretationsspielraum. Er macht sichtbar, welche Aufgabe gelöst werden soll, welche Daten relevant sind, welche Werkzeuge verwendet werden dürfen und woran eine gute Antwort erkennbar ist.
[!NOTE] Kernbotschaft
Prompt-Qualität ist in Agentensystemen ein zentraler Steuerhebel für Zuverlässigkeit und Reproduzierbarkeit.
Grundlegende Prompt-Strukturen
Effektive Prompts trennen Anweisung, Kontext, Beispiele, Eingabe und Ausgabeformat. Diese Trennung ist wichtiger als eine bestimmte Prompt-Schablone, weil Modelle besonders bei längeren Aufgaben sonst Kontext, Regeln und Nutzereingabe vermischen.
Prompt-Bausteine:
AUFGABE:
- Was soll gelöst werden?
KONTEXT:
- Welche Informationen sind relevant?
REGELN:
- Was darf nicht passieren?
BEISPIELE:
- Wie sieht eine gute Ausgabe aus?
EINGABE:
- Welche konkrete Anfrage oder welches Dokument soll verarbeitet werden?
AUSGABEFORMAT:
- In welchem Format soll die Antwort erscheinen?
Bei komplexen Prompts können klare Abschnittsnamen oder XML-ähnliche Tags helfen, etwa <instructions>, <context>, <examples> und <input>. Entscheidend ist nicht das Tag selbst, sondern die eindeutige Trennung der Funktionen.
Typischer Fehler: Beispiele, Kontext und eigentliche Aufgabe in einem Fließtext zu mischen. Das Modell muss dann erraten, welche Teile Anweisung sind und welche Teile nur Daten darstellen.
Zero-Shot, Few-Shot und Reasoning
Zero-Shot Prompting
Das Modell erhält eine Aufgabe ohne Beispiele und löst sie basierend auf seinem Vorwissen.
Prompt-Struktur: Zero-Shot
System:
- Rolle: hilfreicher Assistent.
Aufgabe:
- Klassifiziere die folgende E-Mail als "dringend" oder "normal".
Eingabe:
- E-Mail-Text
Geeignet für:
- Einfache, eindeutige Aufgaben
- Allgemeinwissen-Fragen
- Standardformatierungen
Few-Shot Prompting
Das Modell erhält Beispiele, die das gewünschte Verhalten demonstrieren.
Prompt-Struktur: Few-Shot
System:
- Klassifiziere E-Mails nach Dringlichkeit.
Beispiel 1:
- Eingabe: Betreff "Server ausgefallen"
- Ausgabe: dringend
Beispiel 2:
- Eingabe: Betreff "Quartalsbericht verfügbar"
- Ausgabe: normal
Neue Aufgabe:
- Eingabe: aktueller E-Mail-Betreff
- Ausgabe: dringend oder normal
Geeignet für:
- Spezifische Formatvorgaben
- Domänenspezifische Klassifikationen
- Konsistente Ausgabestrukturen
Beispiele wirken am besten, wenn sie echte Grenzfälle abdecken. Drei fast identische Beispiele verbessern das Format, aber selten die Robustheit. Ein gutes Few-Shot-Set enthält typische Fälle, schwierige Fälle und mindestens ein Negativbeispiel.
Reasoning und Arbeitsplan
Bei mehrstufigen Aufgaben hilft es oft, das Modell zu einer geordneten Bearbeitung anzuhalten. Dabei muss nicht jeder interne Gedankenschritt ausgegeben werden. Für viele Anwendungen genügt ein kurzer Arbeitsplan, eine Begründung der Entscheidung oder eine strukturierte Prüfung entlang fester Kriterien.
[!WARNING] Reasoning gezielt einsetzen
Mehr Nachdenken verbessert komplexe Aufgaben, erhöht aber Token-Verbrauch und Latenz. Für einfache Klassifikation oder Formatierung ist eine direkte Antwort mit klarem Schema meist stabiler.
Prompt-Struktur: Arbeitsplan
Aufgabe:
- Prüfe die folgende Aufgabe entlang der Kriterien.
Arbeitsplan:
1. Bestimme, was gegeben ist.
2. Bestimme, was gesucht wird.
3. Lege die nötigen Schritte fest.
4. Formuliere die Antwort im vorgegebenen Format.
Eingabe:
- konkrete Aufgabe
Ausgabe:
- Ergebnis
- kurze Begründung
- Unsicherheit oder offene Annahmen
Geeignet für:
- Mathematische Probleme
- Logische Schlussfolgerungen
- Mehrstufige Analysen
Nicht geeignet, wenn die Aufgabe deterministisch durch Code, Retrieval oder ein Tool gelöst werden sollte. Ein Prompt ersetzt keine Berechnung, keine Datenbankabfrage und keine Schema-Validierung.
System-Prompts für Agenten
Der System-Prompt definiert die Identität und das Verhalten eines Agenten. Er ist der wichtigste Hebel für konsistentes Agentenverhalten.
[!TIP] Priorisierung im Prompt
Kritische Regeln zuerst platzieren (Sicherheit, Grenzen, Eskalation), danach Stil und Tonalität.
Struktur eines effektiven System-Prompts
Ein guter System-Prompt beantwortet vier Fragen:
| Frage | Inhalt |
|---|---|
| Wer? | Rolle und Expertise des Agenten |
| Was? | Aufgabenbereich und Fähigkeiten |
| Wie? | Verhaltensregeln und Tonalität |
| Was nicht? | Explizite Einschränkungen |
Beispiel: Vollständiger Agent-System-Prompt
System-Prompt: technischer Support-Agent
ROLLE:
- Experte für die Produkte X, Y und Z
- Erste Anlaufstelle für technische Fragen
- Eskalation an Menschen bei komplexen Fällen
FÄHIGKEITEN:
- Zugriff auf die Wissensdatenbank (Tool: search_knowledge)
- Ticket-Erstellung im Helpdesk (Tool: create_ticket)
- Prüfung des Kundenstatus (Tool: check_customer)
VERHALTENSREGELN:
- Antworte präzise und lösungsorientiert
- Frage nach, wenn Informationen fehlen
- Bestätige Verständnis bei komplexen Problemen
- Verwende technische Begriffe nur mit Erklärung
EINSCHRÄNKUNGEN:
- Keine Preisauskünfte oder Vertragsänderungen
- Keine Zusagen ohne Rücksprache mit dem Vertrieb
- Bei Sicherheitsfragen immer an Security-Team eskalieren
Bei agentischen Prompts müssen zusätzlich Autonomie und Persistenz geklärt werden. Ein Agent braucht Regeln dafür, wann er selbst weiterarbeitet, wann er nachfragt, welche Tools Vorrang haben und wie er Fortschritt oder Ergebnis zurückmeldet. Ohne diese Grenzen entstehen zwei typische Fehler: Der Agent fragt zu früh nach, obwohl er mit vorhandenen Informationen weiterarbeiten könnte, oder er arbeitet zu lange autonom, obwohl eine Freigabe nötig wäre.
Typische Fehler bei System-Prompts
| Fehler | Problem | Lösung |
|---|---|---|
| Zu vage | Agent verhält sich inkonsistent | Konkrete Beispiele und Regeln |
| Zu lang | Wichtige Anweisungen gehen unter | Priorisieren, strukturieren |
| Widersprüchlich | Agent “halluziniert” Kompromisse | Eindeutige Hierarchie |
| Keine Grenzen | Agent überschreitet Kompetenz | Explizite Einschränkungen |
Tool-Beschreibungen optimieren
Die Beschreibung eines Tools bestimmt, ob und wann ein Agent es korrekt einsetzt. Eine präzise Beschreibung ist entscheidender als der Code dahinter.
Anatomie einer guten Tool-Beschreibung
Tool: search_knowledge
Zweck:
- Durchsucht die interne Wissensdatenbank nach relevanten Artikeln.
Wann verwenden:
- bei Fragen zu Produktfunktionen
- bei Fehlermeldungen und deren Lösungen
- bei How-To-Anfragen
Wann nicht verwenden:
- bei Fragen zu Preisen oder Verträgen
- bei persönlichen Kundendaten
- wenn die Antwort bereits sicher bekannt ist
Eingaben:
- query: Suchbegriff oder Frage in natürlicher Sprache
- max_results: maximale Anzahl zurückgegebener Artikel
Ausgabe:
- Liste relevanter Wissensartikel mit Titel und Zusammenfassung
Checkliste für Tool-Beschreibungen
[!SUCCESS] Qualitätskriterium
Wenn ein Tool klar beschreibt, wann es verwendet werden soll und wann nicht, sinken Fehlaufrufe und Halluzinationen deutlich.
- Zweck klar benannt – Was macht das Tool?
- Anwendungsfälle – Wann soll es verwendet werden?
- Gegenanzeigen – Wann soll es NICHT verwendet werden?
- Parameter erklärt – Was bedeuten die Eingaben?
- Rückgabewert beschrieben – Was kommt zurück?
Bei Agenten mit mehreren Werkzeugen sollte außerdem die Tool-Auswahl selbst promptbar sein. Das Modell braucht klare Priorität: vorhandene strukturierte Tools vor Shell- oder Freitextlösungen, Retrieval vor Raten, Validierung vor finaler Ausgabe. Spezialwerkzeuge wie semantische Suche, MCP-Server oder eigene Dateitools funktionieren besser, wenn ihre Grenzen und erwarteten Rückgaben getestet werden.
Ausgabeformatierung
Strukturierte Ausgaben machen Agentenantworten verarbeitbar und konsistent.
Explizite Formatvorgaben
Prompt-Struktur: explizite Formatvorgabe
Aufgabe:
- Analysiere den folgenden Text und extrahiere die Kernaussagen.
Eingabe:
- Text
Antwortformat:
HAUPTTHEMA: [Ein Satz]
KERNAUSSAGEN:
- [Punkt 1]
- [Punkt 2]
- [Punkt 3]
STIMMUNG: [positiv/neutral/negativ]
KONFIDENZ: [hoch/mittel/niedrig]
Strukturierte Ausgaben mit Pydantic
Für maschinelle Weiterverarbeitung bietet LangChain typsichere Ausgaben:
[!TIP] Für Produktion bevorzugen
Bei Weiterverarbeitung durch Code sind strukturierte Ausgaben mit Schema-Validierung robuster als freie Textantworten.
Schema: Analyse (Pydantic)
Felder:
- hauptthema: zentrales Thema in einem Satz
- kernaussagen: Liste der wichtigsten Punkte
- stimmung: positiv, neutral oder negativ
- konfidenz: Sicherheit der Analyse zwischen 0.0 und 1.0
Ablauf:
1. Das Modell erhält das Schema als erwartete Ausgabeform.
2. Das Modell analysiert den Text.
3. Die Antwort wird gegen das Schema geprüft.
4. Die Anwendung kann gezielt auf Felder wie hauptthema oder konfidenz zugreifen.
Fortgeschrittene Strategien
Role-Prompting
Die Zuweisung einer spezifischen Rolle verbessert domänenspezifische Antworten.
Prompt-Struktur: Role-Prompting
Rollenbibliothek:
- jurist: erfahrener Rechtsanwalt mit Spezialisierung auf IT-Recht
- mediziner: Facharzt für Innere Medizin mit langjähriger Erfahrung
- entwickler: Senior Software Engineer mit Erfahrung in Python und Cloud-Architekturen
Ablauf:
1. Wähle die passende Rolle zur Aufgabe.
2. Setze diese Rolle als System-Anweisung.
3. Stelle die konkrete Frage als Nutzereingabe.
Self-Consistency
Mehrere Antworten generieren und die häufigste oder konsistenteste wählen.
Strategie: Self-Consistency
Eingaben:
- question: zu beantwortende Frage
- n: Anzahl unabhängiger Antwortversuche
Ablauf:
1. Generiere n Antworten zur gleichen Frage.
2. Vergleiche die Antworten.
3. Bestimme die häufigste, stabilste oder am besten begründete Antwort.
4. Gib diese aggregierte Antwort zurück.
Retrieval-Augmented Prompting
Kontext aus externen Quellen in den Prompt integrieren:
Prompt-Struktur: Retrieval-Augmented Prompting
Anweisung:
- Beantworte die Frage nur auf Basis des bereitgestellten Kontexts.
- Wenn die Antwort nicht im Kontext steht, sage das ausdrücklich.
Eingaben:
- Kontext aus Retrieval
- Frage
Ausgabe:
- Antwort mit Bezug auf den Kontext
Long-Context Prompting
Bei langen Dokumenten oder vielen Eingabedaten reicht eine gute Aufgabenformulierung nicht aus. Der Prompt muss dann die Daten so anordnen, dass das Modell sie zuverlässig zuordnen kann. Lange Dokumente gehören in einen klar markierten Kontextbereich; die eigentliche Frage und die Ausgabeanforderung stehen danach. Das reduziert die Gefahr, dass Metadaten, Beispiele und Nutzereingaben miteinander verwechselt werden.
<context>
Dokumente, Auszüge oder Recherchetreffer
</context>
<instructions>
Beantworte die Frage nur auf Basis des Kontextes.
Wenn der Kontext keine Antwort enthält, gib "Nicht im Kontext" aus.
</instructions>
<question>
Konkrete Frage
</question>
In der Praxis relevant, wenn Dokumente, Tabellen, Tool-Ergebnisse und Beispiele im selben Prompt stehen. Ohne saubere Trennung steigt die Wahrscheinlichkeit, dass das Modell ein Beispiel als echten Inhalt behandelt oder eine Regel nur auf den ersten Abschnitt anwendet.
Agentische Coding-Prompts
Coding-Agenten brauchen andere Prompts als Chat-Assistenten. Neben der Aufgabe müssen Arbeitsregeln für Codebase-Erkundung, Tool-Nutzung, Änderungsscope, Tests und Abschlussbericht festgelegt werden. Besonders wichtig sind persistente Projektregeln, etwa in einer AGENTS.md, weil sie vor jeder konkreten Aufgabe geladen werden und lokale Konventionen sichtbar machen.
Ein guter Coding-Agent-Prompt legt fest:
- welche Such- und Lesewerkzeuge bevorzugt werden,
- wann Dateien geändert werden dürfen,
- wie bestehende Änderungen anderer Entwickler behandelt werden,
- welche Tests nach Änderungen laufen sollen,
- wie Ergebnisse knapp und nachvollziehbar berichtet werden.
Grenze: Solche Prompts verbessern den Arbeitsrahmen, ersetzen aber kein gutes Tooling. Für zuverlässige Codeänderungen braucht der Agent passende Datei-, Patch-, Test- und Suchwerkzeuge.
Best Practices
Die CLEAR-Methode
| Buchstabe | Prinzip | Umsetzung |
|---|---|---|
| C | Concise | Präzise formulieren, Füllwörter vermeiden |
| L | Logical | Logische Struktur, klare Reihenfolge |
| E | Explicit | Erwartungen explizit benennen |
| A | Adaptive | An Aufgabe und Modell anpassen |
| R | Reproducible | Konsistente Ergebnisse ermöglichen |
Iteratives Prompt-Design
flowchart LR
A[Erster Entwurf] --> B[Testen]
B --> C{Ergebnis OK?}
C -->|Nein| D[Analysieren]
D --> E[Anpassen]
E --> B
C -->|Ja| F[Dokumentieren]
Empfohlener Workflow:
- Baseline erstellen – Einfachster funktionierender Prompt
- Schwachstellen identifizieren – Wo versagt der Prompt?
- Gezielt verbessern – Eine Änderung pro Iteration
- Testen mit Varianten – Verschiedene Eingaben prüfen
- Dokumentieren – Warum funktioniert diese Version?
Prompts sollten gegen konkrete Testfälle bewertet werden, nicht nur gegen einen guten Beispieloutput. Für Klassifikation zählen Fehlerraten pro Klasse, für Extraktion zählen fehlende oder falsche Felder, für Agenten zählen Tool-Fehlaufrufe, Abbruchstellen und unnötige Rückfragen.
Prompt-Versionierung
Prompt-Versionierung:
Version classify_email_v1:
- Klassifiziere eine E-Mail als dringend oder normal.
Version classify_email_v2:
- Klassifiziere eine E-Mail nach expliziten Kriterien.
- dringend: Systemausfälle, Sicherheitsprobleme, Deadlines unter 24 Stunden
- normal: alle anderen Anfragen
Produktion:
- Aktive Prompt-Version dokumentieren
- Änderungen nachvollziehbar versionieren
- Testergebnisse pro Version festhalten
Häufige Fehler und Lösungen
[!WARNING] Häufigster Praxisfehler
Ambige Anweisungen sind eine Hauptursache für instabile Ergebnisse. Erst Präzision im Prompt, dann Modellwechsel.
Fehler: Ambige Anweisungen
Problem:
Vage und mehrdeutig:
Aufgabe:
- Fasse das zusammen.
Eingabe:
- Text
Lösung:
Präzise und eindeutig:
Aufgabe:
- Erstelle eine Zusammenfassung in 3 Stichpunkten.
Regeln:
- Jeder Punkt maximal 15 Wörter.
- Fokus auf Handlungsempfehlungen.
Eingabe:
- Text
Fehler: Fehlende Beispiele bei komplexen Formaten
Problem:
Erwartet ein spezifisches Format ohne Beispiel:
Aufgabe:
- Extrahiere Entitäten aus dem Text.
Eingabe:
- Text
Lösung:
Mit Beispiel (Few-Shot):
Aufgabe:
- Extrahiere Entitäten im Format: ENTITÄT (TYP)
Beispiel:
- Text: "Angela Merkel besuchte gestern Berlin."
- Entitäten: Angela Merkel (PERSON), Berlin (ORT), gestern (ZEIT)
Neue Eingabe:
- Text
Fehler: Widersprüchliche Anweisungen
Problem:
Widersprüchlich:
Aufgabe:
- Erkläre das Thema kurz und detailliert.
Problem:
- "kurz" und "detailliert" sind ohne Priorisierung schwer gleichzeitig erfüllbar.
Lösung:
Klare Priorisierung:
Aufgabe:
- Erkläre das Thema in zwei getrennten Teilen.
Struktur:
1. Kurzfassung: 1-2 Sätze mit der Kernaussage
2. Details: 3-5 Sätze mit wichtigen Aspekten
Eingabe:
- Thema
Zusammenfassung
Effektives Prompt Engineering basiert auf vier Säulen:
| Säule | Kernaspekt |
|---|---|
| Klarheit | Eindeutige, strukturierte Anweisungen |
| Kontext | Relevante Informationen und Beispiele |
| Kontrolle | Explizite Formatvorgaben und Grenzen |
| Evaluation | Testfälle, Fehlermuster und Versionierung |
Für KI-Agenten besonders wichtig:
- System-Prompts definieren das Gesamtverhalten
- Tool-Beschreibungen steuern die Werkzeugnutzung
- Strukturierte Ausgaben ermöglichen Weiterverarbeitung
- Iteratives Testen führt zu robusten Prompts
Im weiteren Kursverlauf werden diese Strategien praktisch in LangChain-Agents angewendet.
Ergänzende Ressourcen
| Ressource | Nutzen |
|---|---|
| Claude: Prompting best practices | Klare Anweisungen, Beispiele, XML-Strukturierung, Long-Context-Prompting und agentische Systeme |
| OpenAI Cookbook: Codex Prompting Guide | Prompting für Coding-Agenten, Tool-Nutzung, persistente Projektregeln und Abschlusskommunikation |
Abgrenzung zu verwandten Dokumenten
| Dokument | Frage |
|---|---|
| Context Engineering | Wie wird aus einzelnen Prompts ein belastbarer Gesamtkontext? |
| RAG-Konzepte | Wann reicht bessere Promptformulierung nicht mehr ohne Retrieval? |
| Fine-Tuning | Wann stößt Prompting an Grenzen, die Training besser löst? |
Version: 1.1
Stand: Mai 2026
Kurs: Generative KI. Verstehen. Anwenden. Gestalten.