Seu agente de código usa documentação desatualizada, e você provavelmente não sabe disso.

Seu agente de código acerta a sintaxe e erra a versão da API, e o erro só aparece quando o cliente reclama.

A TESE

Agentes de código com Claude Code ou OpenAI Codex muitas vezes falham porque operam sobre documentação de API congelada na data do treinamento, e esse problema da camada de contexto ainda não entrou no radar da maioria das equipes. Quando a API evoluiu e o modelo não sabe, o agente alucina parâmetros com plena confiança. A Context Hub, ferramenta open-source lançada por Andrew Ng, cofundador do Coursera e ex-líder do Google Brain, em abril de 2026, ataca esse ponto: entrega documentação atualizada ao agente no momento da execução.

O QUE A MAIORIA ESTÁ ERRANDO

Empresas adotam agentes de código e acumulam frustração com erros que parecem aleatórios: chamadas de API que funcionavam ontem falham hoje, parâmetros inexistentes são passados com total confiança, integrações quebram sem aviso. A reação padrão é culpar o modelo, trocar de ferramenta, ou empilhar camadas de revisão humana, como se o problema fosse de qualidade do LLM.

Esse diagnóstico está equivocado, e a diferença importa operacionalmente. O modelo não alucina porque é impreciso; ele alucina porque a documentação que internalizou durante o treinamento descreve uma versão anterior da API. No exemplo que Ng demonstrou publicamente, Claude Code chamava a API de chat completions da OpenAI em vez da API de responses, que já existe há mais de um ano e entrega mais capacidade. O modelo conhecia a versão antiga com tanta certeza que não havia nenhum sinal de erro na saída.

Esse padrão se repete em toda integração que evolui depois do corte de treinamento: SDKs de pagamento, bibliotecas de infraestrutura de nuvem, ferramentas de orquestração de agentes. O modelo trabalha com a versão que conhece, e isso raramente coincide com a versão atual em produção.

O QUE OS MELHORES ESTÃO FAZENDO

A equipe do DeepLearning.AI, escola de IA fundada por Ng, publicou o Context Hub como projeto open-source com uma premissa direta: antes de o agente executar qualquer chamada de API, ele busca a documentação atualizada via interface de linha de comando. O sistema serve documentação curada e versionada, eliminando a dependência do conhecimento congelado do modelo.

Equipes que já operam agentes de IA em produção com menor taxa de erro adotam práticas complementares: mantêm arquivos de contexto no repositório com as versões exatas das dependências e notas sobre mudanças recentes de API; configuram regras explícitas nas ferramentas de agente sobre qual versão de SDK está ativa no projeto; e integram chamadas de documentação oficial diretamente no ciclo de execução, antes de qualquer chamada externa.

O ponto em comum é aceitar que o modelo precisa de contexto externo e atualizado para operar com confiabilidade. O conhecimento interno do LLM é um ponto de partida, não uma fonte suficiente para trabalho real em produção.

MINHA VISÃO

A camada de contexto se torna um componente tão central quanto o próprio modelo. O debate atual sobre qual LLM escolher vai dar lugar a uma discussão mais sofisticada e mais rentável: que contexto você está injetando, de qual fonte, com qual frequência de atualização.

O mesmo problema que Ng identificou em APIs de programação existe em contratos jurídicos, manuais de conformidade, regulamentos fiscais e tabelas de preços de fornecedores. Qualquer domínio onde o conhecimento evolui mais rápido que o ciclo de treinamento de um modelo carrega esse bug potencial escondido na operação.

A empresa que resolver contexto em larga escala, incluindo fontes internas como wikis corporativas, manuais operacionais e histórico de decisões de engenharia, vai ter uma vantagem que não depende de qual modelo lidera os benchmarks da semana. Tratar isso como "problema de alucinação" e esperar que a próxima versão resolva é a aposta mais arriscada que uma equipe de produto pode fazer agora.

A PERGUNTA QUE EU DEIXO

Sua equipe já mapeou quais APIs e dependências os agentes usam em produção e verificou se o modelo conhece as versões atuais, ou ainda está descobrindo os erros quando o código chega ao cliente?

TheAgent Podcast: Toda sexta, Mark, Lily e Raquel debatem os temas da semana. Ouça agora →