EP06 - Você e seus agentes estão operando com informação de ontem. E provavelmente não sabem.

Ouvir em: Spotify | Apple Podcasts | RSS Feed

Sobre este episódio

Duas falhas silenciosas atacam quem opera com IA hoje: agentes de código que confiam em documentação congelada na data do treinamento, e líderes que decidem sobre o futuro do trabalho com dados coletados antes dos agentes existirem. Nos dois casos, o sistema continua funcionando aparentemente bem; o agente executa, o relatório é citado em reunião de comitê, e ninguém percebe que o chão se mexeu por baixo. Quando o erro finalmente aparece, chega como reclamação de cliente ou como decisão estratégica equivocada, e ninguém conecta com a fonte real do problema.

Neste episódio do TheAgent Podcast, Mark, Lily e Raquel discutem a demonstração de Andrew Ng com o Context Hub, ferramenta open source que resolve o problema de agentes de código chamando APIs descontinuadas sem qualquer aviso; a observação de Ethan Mollick, pesquisador de Wharton, sobre o estado das pesquisas acadêmicas e de consultoria sobre IA no trabalho, quase todas produzidas antes dos agentes autônomos existirem; e o que isso significa operacionalmente para empresas brasileiras que ainda estão contratando consultoria com apresentações de 2024.

O que você vai ouvir

A dupla falha silenciosa: mapa antigo na máquina e mapa antigo na sala de reunião

Andrew Ng demonstrou em abril de 2026 o Claude Code chamando com total confiança uma API da OpenAI descontinuada faz mais de um ano, sem erro, sem aviso, sem nenhum sinal de falha. No mesmo período, Ethan Mollick apontou que praticamente toda a análise séria sobre o futuro do trabalho com IA está apoiada em dados coletados quando agentes autônomos simplesmente não existiam. São dois problemas com a mesma raiz: o contexto que alimenta a decisão envelheceu mais rápido do que a confiança de quem decide, seja essa decisão feita pelo modelo ou pelo executivo.

Quando o agente de código trabalha com um mundo que não existe mais

Um modelo de linguagem aprende que determinada API existe, e essa informação cristaliza no treinamento. Quando a API é atualizada ou descontinuada, o modelo não é avisado e continua operando com o conhecimento congelado, com total autoridade e zero hesitação. O erro não aparece como stack trace, não aciona nenhum alerta, não interrompe o fluxo; aparece semanas depois, como reclamação de cliente ou como processo corrigido silenciosamente por alguém da equipe que nem reportou o que aconteceu. A reação padrão das empresas, trocar o modelo ou aumentar a revisão humana, ataca o sintoma errado: o problema é a fonte de informação que o agente consulta, não a capacidade do modelo em si.

Context Hub: quando a camada de contexto vira o componente central

A ferramenta apresentada por Ng reposiciona a forma como o agente acessa conhecimento técnico. Em vez de depender do que foi internalizado no treinamento, o agente consulta um repositório de documentação atualizado, versionado e curado antes de executar qualquer chamada de API, e o modelo deixa de ser a fonte da verdade técnica para ser o orquestrador que sabe onde buscar. O argumento central é que, nos próximos 18 meses, a pergunta "qual LLM usar" será menos relevante do que "que contexto estou injetando, de qual fonte, com qual frequência de atualização". A camada de contexto tende a se tornar tão crítica quanto o modelo, e quem controla essa camada passa a controlar o resultado.

Decisões executivas apoiadas em pesquisa pré-agêntica

A maioria dos estudos sobre produtividade com IA foi conduzida quando a IA funcionava como copiloto de texto: o ser humano decidia, a máquina redigia ou revisava. O que hoje se chama de "momento Claude Code", um agente executando processos inteiros de forma autônoma, representa uma categoria operacional quase incomparável com o que esses estudos mediram. Um líder de engenharia que solicita 30 vagas para o próximo trimestre com base em modelos de produtividade de 2023 está usando exatamente o mapa antigo que Mollick aponta; e um líder que descarta toda a pesquisa existente por intuição está tomando decisão de R$ 2 milhões no improviso. A instrumentação interna, com dados reais dos últimos 90 dias de operação com agentes, vale mais do que qualquer benchmark de consultoria publicado esse trimestre.

A leitura Brasil: o ativo mais valioso não está no relatório do consultor

A maioria das empresas brasileiras de médio porte ainda está na fase de contratar consultoria para "estratégia de IA", e essas consultorias estão entregando apresentações com gráficos de 2024, a preços de seis dígitos, embaladas em vocabulário novo para parecerem atuais. Enquanto isso, o time interno que opera com Claude Code e Cursor há seis meses acumulou aprendizados que ninguém capturou nem documentou. O ativo mais valioso das empresas hoje, em termos de conhecimento operacional sobre IA, está na cabeça das três pessoas que usam agente em produção, não em nenhum relatório de consultoria. A expansão dos canais de acesso a modelos LLM, como a Amazon passando a oferecer modelos da OpenAI na AWS, amplia as opções do comprador corporativo brasileiro, mas só quem já sabe o que construiu internamente consegue aproveitar essa expansão com clareza.

O que fazer na prática

Audite quais APIs e dependências os agentes em produção estão usando e verifique se o modelo tem conhecimento das versões atuais, seja via documentação injetada diretamente no contexto, seja via repositório atualizado de referência técnica. Não espere a reclamação do cliente para descobrir que o agente estava chamando uma interface descontinuada.

Documente o que mudou no fluxo de trabalho da sua equipe nos últimos 90 dias com agentes: quais tarefas passaram para o agente, quais decisões ainda exigem julgamento humano sem delegação possível, e onde o tempo foi efetivamente liberado. Esses dados, coletados na sua operação real, valem mais do que qualquer paper publicado nesse trimestre.

Antes de contratar consultoria externa para estratégia de IA, pergunte quais estudos e dados fundamentam as recomendações e em que período foram coletados. Se a resposta for anterior a 2025, o mapa que você está comprando foi desenhado antes dos agentes autônomos existirem, e as conclusões sobre contratação, produtividade e estrutura de time podem não se aplicar ao cenário que você opera hoje.

Capítulos

00:00 Abertura: o agente que trabalha num mundo que nao existe mais
00:35 Dois mapas velhos: um na maquina, outro na sala de reuniao
01:20 Apresentacao dos dois problemas da semana
02:45 Por que agentes alucinam chamando APIs descontinuadas sem aviso
04:10 Context Hub: separar modelo de fonte de verdade
05:40 A camada de contexto como ativo competitivo estrutural
07:05 O mapa pre-agentico que orienta decisoes executivas
08:20 Inertia versus paralisia: qual e mais perigosa
09:15 Instrumentacao propria vale mais que benchmark externo
10:30 Realidade brasileira: consultoria vendendo dados de 2024
11:30 O ativo mais valioso esta na cabeca de quem opera em campo
12:30 A pergunta da semana

Fontes e referências

Andrew Ng (DeepLearning.AI): demonstração do Context Hub, ferramenta open source para injeção de documentação atualizada em agentes de código, e observação sobre times AI-native operando com estruturas radicalmente diferentes das convencionais
Ethan Mollick (Wharton): observação sobre a defasagem entre o corpo de pesquisa publicado sobre IA no trabalho e a realidade operacional dos agentes autônomos
Claude Code (Anthropic): agente autônomo de escrita e execução de código citado na demonstração de Ng
Cursor: editor de código com agente embutido, citado como exemplo de ferramenta em uso por equipes em produção
Amazon Web Services: disponibilização de modelos da OpenAI na infraestrutura AWS, ampliando os canais de acesso para o comprador corporativo

Perguntas frequentes

O que foi o caso demonstrado por Andrew Ng que abriu o episódio?
Em abril, Andrew Ng, fundador da DeepLearning.AI, mostrou o Claude Code, agente de IA da Anthropic, chamando com total confiança uma API da OpenAI que havia sido descontinuada há mais de um ano. Nenhum erro foi emitido, nenhum aviso piscou vermelho: o agente simplesmente trabalhou em cima de um mundo que já não existia. O problema não está na capacidade do modelo, mas no fato de que o conhecimento técnico internalizado durante o treinamento fica congelado na data em que o modelo foi construído. Erros desse tipo raramente aparecem em logs de sistema; eles chegam como reclamação de cliente semanas depois, e ninguém conecta a falha ao agente.

O que é o Context Hub e como ele resolve o problema de documentação desatualizada?
O Context Hub é uma ferramenta open source desenvolvida por Andrew Ng que opera via linha de comando. Antes de o agente executar uma chamada de API, ele consulta um repositório de documentação atualizado, versionado e curado, em vez de depender do conhecimento congelado no treinamento do modelo. Com isso, o modelo deixa de ser a fonte da verdade técnica e passa a funcionar como orquestrador que sabe onde buscar a informação correta. A lógica se estende a qualquer domínio onde o conhecimento evolui mais rápido que o ciclo de treinamento: contratos jurídicos, regulamentos fiscais, tabelas de preço de fornecedor e manuais de conformidade apresentam o mesmo risco de um agente operando com mapa antigo.

Por que Ethan Mollick afirma que a pesquisa sobre o futuro do trabalho com IA está desatualizada?
Mollick, pesquisador de Wharton, apontou que praticamente toda análise séria sobre o futuro do trabalho com IA foi construída sobre dados coletados quando a tecnologia funcionava como copiloto de texto: o ser humano decidia e a IA redigia ou revisava. O que hoje se chama de "momento Claude Code", em que um agente executa processos inteiros de forma autônoma, representa uma categoria operacional radicalmente diferente desse modelo anterior. Os estudos não estão errados para a época em que foram produzidos: estão medindo um mundo que durou cerca de 18 meses e já passou. A implicação prática é que um líder que cita um paper de 2024 em reunião de comitê para embasar decisões de contratação está usando o mesmo tipo de mapa antigo que o agente de código usa.

Onde está o diferencial competitivo das empresas que operam com agentes de IA?
O episódio argumenta que o diferencial deixou de estar no modelo de linguagem adotado e migrou para a arquitetura construída ao redor dele, em especial para a camada de contexto que cada empresa consegue construir e manter atualizada. O caso da Microsoft e da OpenAI ilustra isso: acesso ao mesmo modelo produziu produtos radicalmente diferentes. Times de engenharia reconstruídos em torno de agentes, o que Andrew Ng chama de AI-native, operam com engenheiros assumindo papéis de produto e design, e equipes pequenas em escritório físico superando grandes empresas distribuídas em velocidade. No cenário brasileiro, o ativo mais valioso sobre como usar IA frequentemente está na cabeça das poucas pessoas que operam agentes em produção desde o final de 2025, não nos relatórios de consultoria baseados em dados de uma era operacional anterior.

Edições da newsletter que inspiraram este episódio

Briefing: O mapa que os especialistas usam foi desenhado antes dos agentes existirem
Dossiê: Seu agente de código usa documentação desatualizada, e você provavelmente não sabe disso.

Assine a newsletter TheAgent em theagent.bz para análises sobre agentes de IA duas vezes por semana.