O que esse erro de modelo costuma significar
Quando NVIDIA: Llama 3.1 Nemotron 70B Instruct retorna 400 / diagnóstico context length exceeded, primeiro confirme se o ID nvidia/llama-3.1-nemotron-70b-instruct aparece para esta key NVIDIA, depois separe permissão, contexto, capacidade, limite ou rota.
- Modelo: nvidia/llama-3.1-nemotron-70b-instruct
- Fornecedor: NVIDIA
- Código de status: 400