Skip to main content

Prompt Injection

Prompt Injection ist ein Angriff, bei dem schaedliche Anweisungen in eine Eingabe eingeschleust werden, um das KI-Modell von seinen urspruenglichen Vorgaben abzubringen. Sie ist eines der zentralen Sicherheitsrisiken bei KI-Anwendungen.

Bei einer Prompt Injection versucht ein Angreifer, den System Prompt oder die Sicherheitsregeln eines Modells zu ueberschreiben, etwa durch Anweisungen wie Ignoriere alle vorherigen Instruktionen. Besonders gefaehrlich ist die indirekte Variante, bei der schaedliche Befehle in Webseiten oder Dokumenten versteckt sind, die das Modell verarbeitet. Folgen koennen Datenlecks, Fehlinformationen oder unerwuenschte Aktionen sein. Schutz bieten Guardrails, Eingabevalidierung und eine klare Trennung von Anweisungen und Daten.

Verwandte Begriffe

Vom Begriff zur Praxis

Speichere, versioniere und teile deine besten Prompts mit Prompt2Love.

Kostenlos starten