Enciclopédia / Confiabilidade
Avaliação de IA
Processo de medir se uma solução de IA responde bem, com segurança e utilidade para o caso real.
Explicação para leigos
Avaliar IA é testar resultados com critérios claros: precisão, utilidade, segurança, custo, velocidade, consistência e impacto no usuário.
Exemplo prático
Antes de liberar um chatbot, a empresa pode testar 100 perguntas reais e classificar respostas como corretas, incompletas ou arriscadas.
Erros comuns
- Avaliar só com exemplos fáceis.
- Olhar apenas para acerto médio e ignorar erros graves.
- Não repetir testes depois de mudar modelo, prompt ou base de dados.
Termos relacionados
- Benchmark
- Guardrails
- Alucinação
