Enciclopédia / Confiabilidade

Avaliação de IA

Processo de medir se uma solução de IA responde bem, com segurança e utilidade para o caso real.

Explicação para leigos

Avaliar IA é testar resultados com critérios claros: precisão, utilidade, segurança, custo, velocidade, consistência e impacto no usuário.

Exemplo prático

Antes de liberar um chatbot, a empresa pode testar 100 perguntas reais e classificar respostas como corretas, incompletas ou arriscadas.

Erros comuns

  • Avaliar só com exemplos fáceis.
  • Olhar apenas para acerto médio e ignorar erros graves.
  • Não repetir testes depois de mudar modelo, prompt ou base de dados.

Termos relacionados

  • Benchmark
  • Guardrails
  • Alucinação