Guardrails: Difference between revisions
Created page with "{{Meta-bok|min=3}} <div class="bok-def"> Los '''guardrails''' (literalmente "barandillas" o "raíles de seguridad") son restricciones explícitas que definen los límites dentro de los cuales un agente de IA puede operar de forma autónoma. Establecen qué puede hacer el agente sin aprobación, qué requiere confirmación humana y qué está completamente prohibido. Son el mecanismo técnico que implementa los niveles de autonomía HITL/HOTL en un..." |
|||
| (2 intermediate revisions by the same user not shown) | |||
| Line 1: | Line 1: | ||
{{Meta-bok|min=3}} | {{Meta-bok|min=3}} | ||
Los '''guardrails''' (literalmente "barandillas" o "raíles de seguridad") son restricciones explícitas que definen los límites dentro de los cuales un agente de IA puede operar de forma autónoma. Establecen qué puede hacer el agente sin aprobación, qué requiere confirmación humana y qué está completamente prohibido. Son el mecanismo técnico que implementa los niveles de autonomía [[Human-in-the-loop|HITL/HOTL]] en un sistema de IA agéntico. | Los '''guardrails''' (literalmente "barandillas" o "raíles de seguridad") son restricciones explícitas que definen los límites dentro de los cuales un agente de IA puede operar de forma autónoma. Establecen qué puede hacer el agente sin aprobación, qué requiere confirmación humana y qué está completamente prohibido. Son el mecanismo técnico que implementa los niveles de autonomía [[Human-in-the-loop|HITL/HOTL]] en un sistema de IA agéntico. | ||
En la terminología de Scrum Manager, los guardrails son la implementación técnica del sistema [[Always / Ask First / Never|Always / Ask First / Never]]: las restricciones ''Always'' (lo que el agente siempre puede hacer), ''Ask First'' (lo que requiere confirmación) y ''Never'' (lo que está prohibido) se traducen en guardrails en la configuración del agente. | En la terminología de Scrum Manager, los guardrails son la implementación técnica del sistema [[Always / Ask First / Never|Always / Ask First / Never]]: las restricciones ''Always'' (lo que el agente siempre puede hacer), ''Ask First'' (lo que requiere confirmación) y ''Never'' (lo que está prohibido) se traducen en guardrails en la configuración del agente. | ||
| Line 31: | Line 28: | ||
== Guardrails en el contexto ágil == | == Guardrails en el contexto ágil == | ||
En el [[Spec-Driven Development|marco SDD]], los guardrails se especifican en la sección de ''Boundaries'' de la spec: las restricciones que aplican al agente durante la implementación de esa spec específica. A diferencia de los guardrails globales (que aplican a todos los agentes del equipo), los guardrails de spec son locales a una tarea concreta. | En el [[Spec-Driven Development (SDD)|marco SDD]], los guardrails se especifican en la sección de ''Boundaries'' de la spec: las restricciones que aplican al agente durante la implementación de esa spec específica. A diferencia de los guardrails globales (que aplican a todos los agentes del equipo), los guardrails de spec son locales a una tarea concreta. | ||
== Error frecuente == | == Error frecuente == | ||
| Line 42: | Line 39: | ||
<div class="bok-tags"> | <div class="bok-tags"> | ||
[[Always / Ask First / Never]] [[Human-in-the-loop]] [[Gobernanza de IA]] [[Agente de IA]] [[Agentic AI]] [[Spec-Driven Development]] [[Prompt injection]] | [[Always / Ask First / Never]] [[Human-in-the-loop]] [[Gobernanza de IA]] [[Agente de IA]] [[Agentic AI]] [[Spec-Driven Development (SDD)]] [[Prompt injection]] | ||
</div> | </div> | ||
Latest revision as of 09:35, 22 May 2026
Los guardrails (literalmente "barandillas" o "raíles de seguridad") son restricciones explícitas que definen los límites dentro de los cuales un agente de IA puede operar de forma autónoma. Establecen qué puede hacer el agente sin aprobación, qué requiere confirmación humana y qué está completamente prohibido. Son el mecanismo técnico que implementa los niveles de autonomía HITL/HOTL en un sistema de IA agéntico.
En la terminología de Scrum Manager, los guardrails son la implementación técnica del sistema Always / Ask First / Never: las restricciones Always (lo que el agente siempre puede hacer), Ask First (lo que requiere confirmación) y Never (lo que está prohibido) se traducen en guardrails en la configuración del agente.
Tipos de guardrails
Guardrails de contenido
Restricciones sobre qué tipo de outputs puede generar el agente: no producir código que acceda a secretos, no incluir datos personales en logs, no generar contenido fuera del dominio de la tarea.
Guardrails de acción
Restricciones sobre qué acciones puede ejecutar el agente de forma autónoma: no hacer commit en ramas de producción, no enviar comunicaciones externas sin aprobación, no modificar ficheros de configuración de entorno.
Guardrails de alcance
Restricciones sobre qué partes del sistema puede tocar el agente: acceso limitado a determinados directorios, solo lectura en bases de datos de producción, prohibición de modificar dependencias sin aprobación.
Guardrails de gasto
Restricciones sobre el consumo de recursos: límite de tokens por sesión, límite de llamadas a APIs externas, alerta cuando el coste supera un umbral.
Guardrails y gobernanza de IA
Los guardrails son la capa técnica de la gobernanza de IA. La gobernanza define las políticas (qué puede y qué no puede hacer la IA); los guardrails las implementan en el sistema. Sin guardrails, las políticas de gobernanza son documentos sin efecto técnico. Sin gobernanza, los guardrails son restricciones arbitrarias sin fundamento en los valores y objetivos del equipo.
Guardrails en el contexto ágil
En el marco SDD, los guardrails se especifican en la sección de Boundaries de la spec: las restricciones que aplican al agente durante la implementación de esa spec específica. A diferencia de los guardrails globales (que aplican a todos los agentes del equipo), los guardrails de spec son locales a una tarea concreta.
Error frecuente
Definir guardrails solo para las acciones más obvias y olvidar los efectos secundarios. Un agente con restricción de "no modificar ficheros de producción" puede igualmente comprometer la seguridad si puede leer secretos de producción y escribirlos en un fichero de log. Los guardrails efectivos piensan en términos de riesgo, no de acciones individuales: ¿qué daño podría causar el agente en el peor caso con los permisos que tiene?
Véase también
¿Quieres avanzar en agilidad? Puedes buscar convocatorias de cursos y exámenes o ir a tu ritmo haciéndote miembro del Club Agile. Esta membresía incluye recursos exclusivos, aulas e-learning y acceso a Skill Arena: un espacio para practicar y medir tus habilidades ágiles a tu ritmo.