EP09 - 80 agentes na folha, 90 mil horas por ano: como a Tecban transformou IA em funcionário
A vantagem competitiva em IA está migrando de qual modelo você usa para qual memória de decisão você acumula, e a Tecban mostra que medir agente em horas devolvidas por equipe já é realidade brasileira.
Ouvir em: Spotify | Apple Podcasts | RSS Feed
Sobre este episódio
Duas histórias da mesma semana se tocam por ângulos opostos e expõem a tensão real de quem opera IA hoje. De um lado, a fragilidade estrutural: o agente corporativo encontra o documento certo, mas esquece a decisão que a empresa já tinha tomado para aquele caso, e o custo disso não aparece em nenhum log de uso. De outro, a Tecban, operadora do Banco24Horas, já roda agente como funcionário registrado e leva o ganho para a apresentação do conselho de administração.
Neste episódio do TheAgent Podcast, Mark, Lily e Raquel discutem por que a vantagem competitiva em IA está migrando de qual modelo você usa para qual memória de decisão a sua empresa consegue acumular e reter. A conversa parte do defeito que ninguém vê no dashboard, sobe para o case brasileiro que mede agente em horas devolvidas por equipe, e fecha amarrando memória, custo de fornecedor, gente nova de implantação e regulação subindo.
O que você vai ouvir
A colisão entre o agente que esquece e o agente que escala
O Dossiê descreve o defeito profundo de agentes que falham em produção porque não retêm o que aprenderam, enquanto o Briefing mostra a Tecban escalando agentes em cima desse mesmo terreno. As duas coisas são verdade ao mesmo tempo, e a pergunta executiva é o que acontece quando elas convivem dentro da mesma empresa. Escalar o que esquece não corrige o problema, apenas multiplica o esquecimento por dezenas de agentes errando em silêncio.
Memória não é busca, é decisão retida
A maioria das empresas trata memória de agente como problema de recuperação, com mais embeddings, mais RAG, mais documento encontrado, o que resolve apenas achar o conteúdo semanticamente relevante. Memória de verdade é o agente lembrar a decisão que a empresa já tomou para um caso específico e repetir essa ação na próxima execução. O conceito de não-regressividade, ligado ao grafo de contexto de decisão de Yann Bilien na Rippletide sobre o ecossistema Neo4j, propõe congelar sequências já validadas e compor sobre elas em vez de redescobrir tudo do zero.
O agente contado como funcionário na Tecban
A Tecban contabiliza noventa e oito casos de uso de IA, com ganhos de produtividade que chegam a trinta e cinco por cento, e cerca de oitenta agentes que somam aproximadamente noventa mil horas de trabalho por ano. Vanessa Oliveira Ferreira, superintendente de TI, fala em ter um agente como funcionário dentro de cada equipe, o que tira a IA do território do piloto e a coloca no território do headcount. A adoção começou sem glamour, com GitHub Copilot no desenvolvimento e Microsoft 365 Copilot nas áreas de negócio, e foi escalando até virar um pelotão de agentes em operação.
Concentração de fornecedor e a memória que precisa ser sua
A Anthropic mira dez vírgula nove bilhões de dólares de receita no segundo trimestre, o que seria o primeiro trimestre lucrativo, depois de quatro vírgula oito bilhões no primeiro, com conversa de captação a uma avaliação de novecentos bilhões de dólares. Para quem constrói operação inteira sobre uma camada de modelo concentrada, isso é poder de mercado e trava de fornecedor, com risco de terceirizar o cérebro da empresa para quem vai precificar como quiser. Se a memória de decisão é o ativo mais defensável, ela precisa ser da empresa, dentro de um sistema agêntico que permita trocar o modelo depois.
Os três fios soltos da operação brasileira
Raquel aterrissa a semana em três pontos práticos para quem decide. O primeiro é gente: Aaron Levie, CEO da Box, defende que o Forward Deployed Engineer, o engenheiro de implantação avançada que vai na ponta redesenhar o processo do cliente interno, é a competência que sustenta a escala enquanto a IA muda rápido. O segundo é risco: a OpenAI reforçou salvaguardas após o caso de Tumbler Ridge, com Sam Altman aceitando reportar infratores de alto risco e abrir canal direto com a polícia. O terceiro é dinheiro se movendo sozinho: a Stripe lançou duzentos e oitenta e oito produtos no Sessions, com cobrança por uso de agente e Radar expandido para fraude em padrão novo.
O que fazer na prática
- Separe memória de busca antes de comprar mais ferramenta, avaliando se os seus agentes apenas encontram documentos ou se retêm decisões já tomadas pela empresa para casos repetidos.
- Troque a pergunta de "vale a pena fazer prova de conceito" por "quantas horas por ano cada agente devolve", definindo um caso de uso e uma métrica de horas por equipe.
- Projete a arquitetura agêntica para que o modelo LLM seja substituível, mantendo a memória de decisão dentro da sua empresa e reduzindo dependência de um único fornecedor.
Capítulos
- 00:00 Abertura: o agente que esquece e o banco que conta agente como gente
- 00:35 A colisão entre o defeito estrutural e quem já escala em cima dele
- 01:30 Escalar o que esquece é multiplicar o erro silencioso em produção
- 02:45 Memória não é busca: por que RAG e embeddings não resolvem o problema
- 04:00 Não-regressividade e o grafo de contexto de decisão explicados sem jargão
- 05:15 O modelo vira commodity, a memória de decisão acumulada vira o ativo
- 06:30 Tecban: o agente contado como funcionário dentro de cada equipe
- 07:45 Noventa mil horas por ano e até 35% de ganho de produtividade
- 08:45 De GitHub Copilot a um pelotão de oitenta agentes em operação
- 09:45 Anthropic, trava de fornecedor e o risco de terceirizar o cérebro da empresa
- 10:45 Forward Deployed Engineers e a nova competência humana para escalar agentes
- 11:30 Risco regulatório: o caso da OpenAI e o dever concreto de reportar
- 12:15 Stripe e o dinheiro que começa a se mover sozinho entre agentes
- 12:45 A pergunta: o que seu agente aprendeu que ainda vai saber semana que vem
Fontes e referências
- Tecban (Banco24Horas): noventa e oito casos de uso de IA, ganhos de até trinta e cinco por cento, cerca de oitenta agentes e aproximadamente noventa mil horas por ano, com Vanessa Oliveira Ferreira, superintendente de TI.
- Rippletide e Neo4j: Yann Bilien, co-fundador e cientista-chefe, sobre o grafo de contexto de decisão e o conceito de não-regressividade.
- Anthropic: meta de dez vírgula nove bilhões de dólares de receita no segundo trimestre, quatro vírgula oito bilhões no primeiro e avaliação discutida de novecentos bilhões de dólares.
- Aaron Levie (Box): publicação no X sobre o papel do Forward Deployed Engineer na fase de implantação de agentes.
- OpenAI: reforço de salvaguardas após o caso de Tumbler Ridge, com compromisso de Sam Altman de reportar infratores de alto risco às autoridades.
- Stripe (Sessions): duzentos e oitenta e oito novos produtos, cobrança por uso de agente no modelo pay as token burns e Radar expandido contra fraude.
Perguntas frequentes
Por que agentes de IA corporativos esquecem o que aprendem?
A maioria das empresas trata memória de agente como um problema de busca, investindo em mais embeddings, mais RAG e mais documentos recuperados. Isso resolve apenas encontrar o documento semanticamente relevante, mas não tem relação com memória de verdade. Memória é quando o agente lembra uma decisão que a empresa já tomou para um caso específico e repete essa ação na execução seguinte. Sem isso, o agente acha o contrato certo mas esquece a regra que a empresa já tinha definido, e o custo aparece no processo refeito em silêncio e no cliente que foi embora.
O que significa não-regressividade na memória de um agente?
Não-regressividade é a capacidade de congelar uma sequência de ações já validada e construir em cima dela, em vez de recomeçar do zero a cada execução. A ideia vem de um framework chamado grafo de contexto de decisão, que dá ao agente memória estruturada com noção de tempo e lógica de decisão explícita. Yann Bilien, co-fundador e cientista-chefe da Rippletide, startup que construiu isso no ecossistema da Neo4j, resume que quando o agente gera algo novo ele precisa compor sobre as descobertas anteriores, não redescobrir. É a diferença entre lembrar onde está a informação e lembrar o que a empresa já decidiu sobre ela.
Como a Tecban está usando agentes de IA na prática?
A Tecban, que opera o Banco24Horas, já contabiliza noventa e oito casos de uso de IA, com ganhos de produtividade que chegam a trinta e cinco por cento. São cerca de oitenta agentes em operação, totalizando aproximadamente noventa mil horas de trabalho por ano, e a superintendente de TI Vanessa Oliveira Ferreira fala em ter um agente como funcionário dentro de cada equipe. A adoção começou sem glamour, com GitHub Copilot nas equipes de desenvolvimento, depois Microsoft 365 Copilot e Copilot Chat nas áreas de negócio. O que muda no caso não é a tecnologia, é o substantivo: chamar o agente de funcionário e medir em horas por ano tira a IA do território do projeto-piloto e a coloca no território do headcount.
Por que depender de um único fornecedor de modelo é um risco para quem escala agentes?
A Anthropic está mirando dez vírgula nove bilhões de dólares de receita no segundo trimestre, depois de gerar quatro vírgula oito bilhões no primeiro, com conversa de captação a uma avaliação de novecentos bilhões de dólares. Esse poder de mercado representa trava de fornecedor: quem constrói toda a operação de agente sobre uma camada de modelo concentrada pode estar terceirizando o cérebro da empresa para alguém que vai precificar como quiser daqui a dois anos. Se a memória de decisão do agente é o ativo mais importante, ela precisa pertencer à empresa, não ao fornecedor do modelo. A recomendação prática é construir um sistema agêntico no qual seja possível trocar o modelo LLM depois, sem ficar dependente de um único fornecedor.
Edições da newsletter que inspiraram este episódio
- Briefing: Um banco brasileiro já trata agentes de IA como funcionários. E mede o ganho em 35%.
- Dossiê: Seu agente esquece tudo que aprende. É por isso que ele falha em produção.
Assine a newsletter TheAgent em theagent.bz para análises sobre agentes de IA duas vezes por semana.