Enciclopédia / Segurança
Prompt Injection
Tentativa de manipular a IA para ignorar instruções, revelar dados ou executar ações indevidas.
Explicação para leigos
Prompt injection ocorre quando alguém coloca instruções maliciosas em uma mensagem, documento ou página para enganar o sistema de IA.
Exemplo prático
Um e-mail pode conter texto escondido dizendo ao agente para ignorar regras e enviar dados internos a um endereço externo.
Erros comuns
- Confiar em instruções vindas de documentos externos.
- Dar acesso a ferramentas sem validação.
- Não separar dados de usuário, instruções do sistema e ações críticas.
Termos relacionados
- Guardrails
- Privacidade de Dados
- Ferramentas
