Google Research Lança ReasoningBank: Agentes de IA Aprendem Estratégias de Raciocínio com Sucesso e Fracasso

Mensagem da Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória de agente que permite que agentes baseados em modelos de linguagem aprendam continuamente após a implantação. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas quanto de tarefas fracassadas, armazenando-as em um banco de memória para recuperação e execução em tarefas futuras similares. O artigo associado foi publicado no ICLR, e o código foi disponibilizado como open source no GitHub.

O ReasoningBank melhora em relação a duas abordagens existentes: Synapse, que registra trajetórias completas de ação, mas tem transferibilidade limitada devido à granularidade fina, e Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank faz duas mudanças importantes: armazenar “padrões de raciocínio” em vez de “sequências de ação”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajetórias de falha ao aprendizado. O framework usa um modelo para se autoavaliar trajetórias de execução, transformando experiências de falha em regras anti-armadilhas. Por exemplo, a regra “clicar no botão Carregar Mais quando for visto” evolui para “verificar primeiro o identificador da página atual, evitar loops infinitos de rolagem e depois clicar em carregar mais.”

O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca computação adicional durante a inferência para explorar múltiplas trajetórias e armazenar os achados no banco de memória. A expansão em paralelo executa múltiplas trajetórias distintas para a mesma tarefa, refinando estratégias mais robustas por meio de auto comparação; a expansão sequencial refina iterativamente uma única trajetória, armazenando o raciocínio intermediário na memória.

Em tarefas de navegador do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou 8,3% a mais na taxa de sucesso no WebArena e 4,6% a mais no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de etapas por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu as etapas em mais 0,4.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

NeoCognition arrecada $40M na captação seed para agentes de IA com aprendizado no trabalho

Mensagem do Gate News, 22 de abril — O laboratório de pesquisa em IA NeoCognition anunciou a conclusão de uma rodada seed de $40 milhões, saindo do modo stealth. Fundada pelo professor associado da Ohio State University, Yu Su, junto com Xiang Deng e Yu Gu, a empresa tem sede em Palo Alto, Califórnia. A rodada w

GateNews9m atrás

PicWe Lança Carteira com Agente de IA com Gerenciamento de Chaves no Dispositivo

PicWe anuncia o beta público do PicWe Wallet, uma carteira de chaves no dispositivo habilitada por agentes de IA, sem frases de recuperação. Ela oferece suporte a ativos multi-chain, swaps, automação acessível por IA e tem como objetivo unificar a infraestrutura de RWA. A PicWe lançou o beta público do PicWe Wallet, uma carteira com habilitação de Agente de IA que armazena as chaves no dispositivo, elimina frases de recuperação e mantém operações críticas localmente. O beta oferece suporte ao gerenciamento de ativos multi-chain, swaps e ao pagamento de taxas em stablecoins, ao mesmo tempo em que habilita interações programáveis com IA. As iniciativas mais amplas da PicWe posicionam a plataforma como infraestrutura unificada para ativos do mundo real, possibilitando emissão, circulação, liquidação, pagamentos transfronteiriços, tokenização e coordenação da cadeia de suprimentos para casos de uso empresariais.

GateNews53m atrás

Hugging Face lança ml-intern de código aberto, um agente de IA para pesquisa autônoma em ML

ml-intern de código aberto, agente autônomo de pesquisa em ML da Hugging Face que lê artigos, seleciona dados, treina, avalia e itera entre ciência, medicina e matemática. Resumo: o ml-intern da Hugging Face é um agente autônomo de pesquisa em ML de código aberto que lê artigos, seleciona conjuntos de dados, treina em GPUs locais ou na nuvem, avalia resultados e itera melhorias. Construído sobre smolagents com interfaces de CLI e web, ele navega por arXiv/HF Papers, HF Hub e HF Jobs. As demonstrações abrangem ciência, medicina e matemática, mostrando automação ponta a ponta e ganhos de desempenho.

GateNews57m atrás

Professor da Tsinghua Dai Jifeng Lança Naive.ai, Levanta ~$300M em $800M Avaliação

Mensagem do Gate News, 22 de abril — Dai Jifeng, professor associado do Departamento de Engenharia Eletrônica da Universidade Tsinghua, fundou a Naive.ai, uma empresa focada em pós-treinamento de modelos de código aberto e em agentes de IA. A startup levantou aproximadamente $300 milhões com uma avaliação estimada de US$ 80

GateNews2h atrás

AWS Expands Multi-Agent AI Workflows, Supports Claude Opus 4.7 on Bedrock

Gate News message, April 22 — Amazon Web Services announced expansion of its agentic AI initiatives through multi-agent workflows, supporting Anthropic's Claude Opus 4.7 on Amazon Bedrock to help customers move beyond generative AI pilots. The company is expanding partner relationships as customers

GateNews2h atrás

0G Labs faz parceria com a Alibaba Cloud para habilitar acesso a agentes de IA on-chain ao modelo Qwen

Mensagem do Gate News, 22 de abril — 0G Labs anunciou uma parceria com a Alibaba Cloud para permitir que agentes de IA invoquem diretamente o modelo grande de linguagem Qwen da Alibaba on-chain por meio da infraestrutura de blockchain da 0G. A colaboração marca uma mudança nos paradigmas de acesso à IA, saindo de abordagens baseadas em API para uma infraestrutura de IA programável e tokenizada, na qual agentes de IA podem chamar o Qwen para inferência diretamente na rede 0G, com a verificação a cargo da 0G.

GateNews3h atrás
Comentário
0/400
Sem comentários