Enciclopédia / Uso prático
Inferência
O momento em que a IA usa o que aprendeu para produzir uma resposta, previsão ou decisão.
Explicação para leigos
Inferência acontece quando um modelo já treinado recebe uma entrada nova e calcula uma saída: resposta, classificação, resumo, recomendação ou imagem.
Exemplo prático
Quando você envia uma pergunta ao chatbot e ele responde, isso é inferência acontecendo em tempo real.
Erros comuns
- Confundir inferência com treinamento.
- Ignorar custo e velocidade de resposta.
- Achar que toda inferência é determinística.
Termos relacionados
- Treinamento
- Temperatura
- Custo por Token
