Enciclopédia / Uso prático

Inferência

O momento em que a IA usa o que aprendeu para produzir uma resposta, previsão ou decisão.

Explicação para leigos

Inferência acontece quando um modelo já treinado recebe uma entrada nova e calcula uma saída: resposta, classificação, resumo, recomendação ou imagem.

Exemplo prático

Quando você envia uma pergunta ao chatbot e ele responde, isso é inferência acontecendo em tempo real.

Erros comuns

  • Confundir inferência com treinamento.
  • Ignorar custo e velocidade de resposta.
  • Achar que toda inferência é determinística.

Termos relacionados

  • Treinamento
  • Temperatura
  • Custo por Token