Enciclopédia / Segurança

Prompt Injection

Tentativa de manipular a IA para ignorar instruções, revelar dados ou executar ações indevidas.

Explicação para leigos

Prompt injection ocorre quando alguém coloca instruções maliciosas em uma mensagem, documento ou página para enganar o sistema de IA.

Exemplo prático

Um e-mail pode conter texto escondido dizendo ao agente para ignorar regras e enviar dados internos a um endereço externo.

Erros comuns

  • Confiar em instruções vindas de documentos externos.
  • Dar acesso a ferramentas sem validação.
  • Não separar dados de usuário, instruções do sistema e ações críticas.

Termos relacionados

  • Guardrails
  • Privacidade de Dados
  • Ferramentas