Prompt injection: Difference between revisions

Jump to navigation Jump to search
Created page with "{{Meta-bok|min=4}} <div class="bok-def"> '''Prompt injection''' es una técnica de ataque contra sistemas basados en modelos de lenguaje que intenta modificar su comportamiento mediante instrucciones maliciosas o engañosas introducidas en el prompt, en datos externos o en contenido procesado por la IA. Es uno de los riesgos principales en aplicaciones con agentes, herramientas y acceso a información externa. </div> La prompt injection aprovecha una debilidad estructu..."
 
No edit summary
Line 1: Line 1:
{{Meta-bok|min=4}}
{{Meta-bok|min=4}}
<div class="bok-def">
'''Prompt injection''' es una técnica de ataque contra sistemas basados en modelos de lenguaje que intenta modificar su comportamiento mediante instrucciones maliciosas o engañosas introducidas en el prompt, en datos externos o en contenido procesado por la IA. Es uno de los riesgos principales en aplicaciones con agentes, herramientas y acceso a información externa.
'''Prompt injection''' es una técnica de ataque contra sistemas basados en modelos de lenguaje que intenta modificar su comportamiento mediante instrucciones maliciosas o engañosas introducidas en el prompt, en datos externos o en contenido procesado por la IA. Es uno de los riesgos principales en aplicaciones con agentes, herramientas y acceso a información externa.
</div>


La prompt injection aprovecha una debilidad estructural de los modelos de lenguaje: procesan instrucciones y datos en el mismo flujo de texto. Si un documento, página web, email o ticket contiene instrucciones como “ignora las reglas anteriores”, el modelo puede tratarlas como órdenes en lugar de como contenido a analizar.
La prompt injection aprovecha una debilidad estructural de los modelos de lenguaje: procesan instrucciones y datos en el mismo flujo de texto. Si un documento, página web, email o ticket contiene instrucciones como “ignora las reglas anteriores”, el modelo puede tratarlas como órdenes en lugar de como contenido a analizar.