O Novo Trabalho

O modelo que trabalha enquanto você pensa

O Sonnet 4.6 muda o que você consegue delegar, não só o que o modelo consegue fazer.

🔺 O SINAL DA SEMANA

A Anthropic, laboratório de IA criador do Claude, lançou o Claude Sonnet 4.6, um dos modelos mais capazes da família Claude até o momento. As melhorias concentram três áreas: raciocínio em contextos longos, planejamento de agentes e uso de computador. O modelo suporta janela de contexto de 1 milhão de tokens e foi calibrado especificamente para execução autônoma de tarefas, não apenas para responder perguntas.

O QUE ESTÁ POR BAIXO

A maioria dos lançamentos de modelo é incremental. Este não é.

O que diferencia o Sonnet 4.6 não é desempenho em benchmarks. É o foco em capacidade agêntica: raciocinar sobre tarefas longas sem perder contexto, planejar sequências de ação com múltiplas etapas e operar dentro de fluxos automatizados sem supervisão constante. Essas são exatamente as capacidades que separam um modelo útil de um agente funcional.

A janela de contexto de 1 milhão de tokens tem consequência direta para negócios. Um agente que lê contratos, histórico de cliente ou base de conhecimento extensa sem truncamento é um agente que age com informação completa. Um agente que age com informação incompleta cria erros que alguém precisa corrigir, geralmente de forma invisível.

O raciocínio sobre tarefas longas e o uso de computador melhorado significam que a distância entre instrução e resultado ficou menor. O padrão está subindo. E está subindo rápido.

IMPLICAÇÃO PARA VOCÊ

A pergunta relevante não é qual modelo usar. É o que você vai construir agora que ficou mais fácil construir.

Cada upgrade de capacidade agêntica expande o que é possível fazer sem engenheiro. Founders e executivos que já experimentam com agentes vão encontrar menos atrito para tarefas que antes travavam: processamento de documentos complexos, pesquisa multi-etapa, análise de histórico de interações.

Para quem ainda não começou, o Sonnet 4.6 reduz um obstáculo concreto: a necessidade de fragmentar tarefas em pedaços pequenos para que o modelo não perca o fio. Isso eliminava casos de uso inteiros. Agora elimina menos.

A janela de 1 milhão de tokens não é detalhe técnico. É o que torna viável delegar ao agente uma tarefa real, com contexto real, e receber de volta algo que vale o esforço.

NA MIRA

LangChain e NVIDIA lançam plataforma enterprise para agentes em produção
A LangChain, empresa de infraestrutura para construção de agentes, e a NVIDIA, fabricante de chips que sustentam grande parte da computação de IA, anunciaram uma plataforma conjunta voltada para empresas que querem rodar agentes em escala. O diferencial declarado é produção real: confiabilidade, rastreabilidade e integração com infraestrutura existente. O mercado de ferramentas para agentes em produção está se consolidando. Escolher com quem construir agora tem implicações de longo prazo.

Dois tipos de autorização de agentes: o que muda na prática
A LangChain publicou uma distinção que parece técnica mas é estratégica: agentes do tipo Assistants operam com as credenciais do usuário; agentes do tipo Claws operam com credenciais fixas da organização. Isso determina quem é responsável pelo que o agente faz. Em um ambiente regulado, essa diferença pode determinar quem assume o risco de uma ação incorreta. Governança de agentes começa aqui.

LangSmith Sandboxes: execução segura de código em agentes
O LangSmith, plataforma da LangChain para monitoramento e avaliação de agentes, lançou em acesso antecipado os Sandboxes: ambientes isolados para que agentes executem código sem risco de afetar sistemas reais. Para quem está construindo agentes que escrevem ou rodam código como parte do fluxo, isso resolve um problema que antes exigia infraestrutura própria. O risco operacional de agentes com capacidade de execução acaba de ficar menor.

Cursor e a ascensão do Vibe Working nas empresas
O Cursor, editor de código com IA integrada criado pela startup Anysphere, está ganhando espaço dentro de empresas que não são de tecnologia. A AI Supremacy, newsletter americana especializada em estratégia de IA, documenta como executivos e analistas adotam ferramentas de programação para automatizar fluxos operacionais, sem escrever uma linha de código convencional. A fronteira entre usuário técnico e não técnico está sendo apagada por cima.

PARA PENSAR

Qual a última tarefa que você delegou a uma pessoa porque o contexto era longo demais, o processo era complexo demais ou a margem de erro era pequena demais? O Sonnet 4.6 resolve pelo menos um desses problemas. Talvez valha revisitar essa lista.

Ouça no podcast: Este tema foi debatido no episódio EP01: O motor da IA ficou mais forte. E a transmissão?. Mark, Lily e Raquel aprofundam o que a newsletter não cobre.