Google lança ReasoningBank, agentes inteligentes extraem estratégias de raciocínio a partir de experiências de sucesso e fracasso

BlockBeatNews

De acordo com o monitoramento Beating, o Google Research lançou a estrutura de memória de agentes inteligentes ReasoningBank, permitindo que agentes impulsionados por grandes modelos aprendam continuamente após a implantação. A abordagem central é extrair as experiências de sucesso e fracasso de tarefas passadas e armazená-las como estratégias de raciocínio gerais na memória, para que na próxima tarefa semelhante possam primeiro recuperar e depois executar. O artigo relacionado foi publicado na ICLR, e o código já está open source no GitHub.

Anteriormente, duas soluções principais apresentavam suas limitações: o Synapse registra o trajeto completo de ações, mas sua granularidade é muito fina para transferência; o Agent Workflow Memory extrai apenas fluxos de trabalho de casos de sucesso. O ReasoningBank fez duas mudanças: mudou o objeto de armazenamento de “sequência de ações” para “padrão de raciocínio”, com cada memória contendo três campos estruturados de título, descrição e conteúdo; além disso, o trajeto de fracasso também foi incorporado ao aprendizado. O modelo chama outro grande modelo para autoavaliar o trajeto de execução, e as experiências de fracasso são divididas em regras para evitar armadilhas, por exemplo, de “ver o botão Carregar Mais” para “verificar primeiro o identificador da página atual para evitar rolagem infinita, antes de clicar em carregar mais”.

O artigo também propõe o Memory-aware Test-time Scaling (MaTTS), que investe mais poder de processamento durante o raciocínio para tentar várias vezes, armazenando o processo de exploração na memória. A expansão paralela permite que o agente execute múltiplos trajetos diferentes para a mesma tarefa, extraindo estratégias mais robustas por auto comparação; a expansão sequencial refina repetidamente dentro de um único trajeto, registrando o raciocínio intermediário na memória.

Nos benchmarks WebArena de tarefas de navegador e SWE-Bench-Verified de tarefas de código, usando o Gemini 2.5 Flash para o agente ReAct, o ReasoningBank superou a linha de base sem memória com uma taxa de sucesso 8,3% maior na WebArena e 4,6% na SWE-Bench-Verified, com uma redução média de cerca de 3 passos por tarefa; após adicionar a expansão paralela MaTTS (k=5), a taxa de sucesso na WebArena aumentou mais 3 pontos percentuais, e o número de passos diminuiu mais 0,4.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

NeoCognition Capta $40M em Financiamento de Seed para Agentes de IA de Aprendizagem no Trabalho

Mensagem do Gate News, 22 de Abril — O laboratório de investigação em IA NeoCognition anunciou a conclusão de uma ronda de seed de $40 milhões, saindo do modo stealth. Fundada pelo Professor Associado da Universidade Estadual de Ohio Yu Su, juntamente com Xiang Deng e Yu Gu, a empresa tem sede em Palo Alto, Califórnia. A ronda w

GateNews8m atrás

PicWe Lança Carteira com Agente de IA com Gestão de Chaves no Dispositivo

PicWe anuncia uma versão beta pública do PicWe Wallet, uma carteira de chaves sem frases de recuperação, com agentes de IA e capaz de funcionar no dispositivo. Suporta ativos multi-cadeia, swaps, automação acessível por IA e tem como objetivo unificar a infraestrutura de RWA. A PicWe lançou a versão beta pública do PicWe Wallet, uma carteira com agentes de IA que armazena as chaves no dispositivo, elimina as frases de recuperação e mantém operações críticas locais. A beta suporta gestão de ativos multi-cadeia, swaps e pagamentos de taxas baseadas em stablecoins, ao mesmo tempo que permite interações programáveis com IA. As iniciativas mais amplas da PicWe posicionam a plataforma como uma infraestrutura unificada para ativos do mundo real, possibilitando emissão, circulação, liquidação, pagamentos transfronteiriços, tokenização e coordenação da cadeia de abastecimento para casos de uso empresariais.

GateNews52m atrás

Hugging Face disponibiliza em código aberto o ml-intern, um agente de IA para investigação autónoma em ML

Com código aberto, ml-intern da Hugging Face, um agente autónomo de investigação em ML que lê artigos, seleciona dados, treina, avalia e evolui entre a ciência, a medicina e a matemática. Resumo: ml-intern da Hugging Face é um agente autónomo de investigação em ML de código aberto que lê artigos, seleciona conjuntos de dados, treina em GPUs locais ou na cloud, avalia resultados e melhora iterativamente. Construído com smolagents, com interfaces de linha de comandos (CLI) e web, navega por arXiv/HF Papers, HF Hub e HF Jobs. As demonstrações abrangem ciência, medicina e matemática, evidenciando automação de ponta a ponta e ganhos de desempenho.

GateNews56m atrás

A Google Research lança o ReasoningBank: agentes de IA aprendem estratégias de raciocínio com sucesso e falha

Mensagem do Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória do agente que permite que agentes orientados por grandes modelos de linguagem aprendam continuamente após o deploy. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas como falhadas em tarefas, guardando

GateNews1h atrás

Professor da Tsinghua Dai Jifeng Lança Naive.ai, Angaria ~$300M a $800M Valuation

Mensagem do Gate News, 22 de abril — Dai Jifeng, professor associado no Departamento de Engenharia Eletrónica da Universidade Tsinghua, fundou a Naive.ai, uma empresa focada no pós-treinamento de modelos de código aberto e em agentes de IA. A startup angariou aproximadamente $300 milhões numa valorização estimada de $80

GateNews2h atrás

AWS Expands Multi-Agent AI Workflows, Supports Claude Opus 4.7 on Bedrock

Gate News message, April 22 — Amazon Web Services announced expansion of its agentic AI initiatives through multi-agent workflows, supporting Anthropic's Claude Opus 4.7 on Amazon Bedrock to help customers move beyond generative AI pilots. The company is expanding partner relationships as customers

GateNews2h atrás
Comentar
0/400
Nenhum comentário