Mensagem do Gate News, 23 de abril — A equipa de investigação da Perplexity publicou um artigo técnico que detalha a sua metodologia de pós-treinamento para agentes de pesquisa na web. A abordagem utiliza dois modelos Qwen3.5 de código aberto (Qwen3.5-122B-A10B e Qwen3.5-397B-A17B) e recorre a um pipeline em duas etapas: fine-tuning supervisionado (SFT) para estabelecer obediência a instruções e consistência linguística, seguido de aprendizagem por reforço online (RL) para otimizar a precisão da pesquisa e a eficiência no uso de ferramentas.
A fase de RL utiliza o algoritmo GRPO com duas fontes de dados: um conjunto de dados proprietário de perguntas e respostas verificáveis multi-hop construído a partir de queries iniciais internas que exigem 2–4 hops de raciocínio com verificação por múltiplos solucionadores, e dados conversacionais gerais baseados em rubricas que convertem requisitos de implementação em condições atómicas objetivamente verificáveis para evitar a degradação do comportamento do SFT.
O desenho de recompensas emprega agregação com gating — as pontuações de preferência só contribuem quando a correcção de base é alcançada (correspondência pergunta-resposta ou quando todos os critérios da rubrica são satisfeitos), impedindo que sinais de preferência elevados mascarem erros factuais. As penalizações de eficiência utilizam ancoragem dentro do grupo, aplicando penalizações suaves às chamadas de ferramentas e ao comprimento da geração que excede a base de respostas correctas no mesmo grupo.
A avaliação mostra que o Qwen3.5-397B-SFT-RL atinge o melhor desempenho de referência em benchmarks de pesquisa. No FRAMES, alcança 57,3% de precisão com uma única chamada de ferramenta, superando o GPT-5.4 em 5,7 pontos percentuais e o Claude Sonnet 4.6 em 4,7 pontos percentuais. Sob um orçamento moderado (quatro chamadas de ferramentas), atinge 73,9% de precisão a $0,02 por consulta, em comparação com 67,8% de precisão do GPT-5.4 a $0,085 por consulta e 62,4% de precisão do Sonnet 4.6 a $0,153 por consulta. Os valores de custo baseiam-se na tarifação pública por API de cada fornecedor e excluem optimizações de caching.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
A NVIDIA lança Nemotron 3 Nano Omni open source multimodal
A NVIDIA divulga o Nemotron 3 Nano Omni, um modelo multimodal de código aberto, integrando visão, voz e linguagem num único modelo, como camada de perceção para agentes de IA. O núcleo é um 30B-A3B MoE, um context de 256K e um throughput de 9x. Suporta entradas como texto, imagem, áudio e vídeo, com saída em texto. Em conjunto com o Nemotron 3 Super/Ultra, é aplicável a cenários como operação de computadores, inteligência documental e compreensão audiovisual, e publica os pesos e os dados de treino, com implementação cobrindo o local, NIM e plataformas de terceiros.
ChainNewsAbmedia1h atrás
A TON Tech Lança Agentes com IA para Transações On-Chain Autónomas
Mensagem de Gate News, 28 de abril — A TON Tech, a equipa de desenvolvimento por detrás da blockchain TON preferida do Telegram, lançou agentes com IA capazes de executar autonomamente transações-chave on-chain. Os utilizadores podem financiar uma carteira dedicada para um agente, que pode então realizar transferências, swaps, atividades DeFi
GateNews3h atrás
B.AI e CROSS fazem parceria para explorar agentes de IA em infraestruturas de gaming Web3
Mensagem do Gate News, 28 de abril — A B.AI, uma plataforma de infraestrutura financeira digital de próxima geração para agentes de IA, anunciou ontem (27 de abril) uma parceria estratégica com a CROSS, um fornecedor de infraestrutura de gaming Web3 full-stack. A colaboração tem como objetivo explorar como os agentes de IA podem automatizar
GateNews4h atrás
Relatório da Messari Analisa o Desenvolvimento da Arquitetura de Trading com IA
Mensagem do Gate News, 28 de abril — O mais recente relatório Pulse da Messari fornece uma análise aprofundada do sistema de trading com IA de uma CEX líder, revelando uma arquitetura de produto de IA de quatro camadas, composta por componentes de análise de mercado, execução autónoma, integração com programadores e interação de estratégia.
O componente de interação de estratégia
GateNews8h atrás
Amber Premium regista receitas recorde de 66,1 M$ em 2025, o volume de negociação ultrapassa 11 mil M$
Mensagem de Gate News, 28 de abril — Amber International Holding Limited (Amber Premium) alcançou um volume de negócios recorde de 66,1 milhões de dólares em 2025, com o volume de negociação anual a ultrapassar $11 billion. Os ativos médios dos clientes atingiram 1,3 milhões de dólares.
A empresa obteve oficialmente a licença VARA VASP de Dubai em abril e h
GateNews10h atrás
A Ant International Lança o Protocolo Móvel Agentic Open Source para Pagamentos por IA
Mensagem da Gate News, 28 de abril — A Ant International lançou o Protocolo Móvel Agentic Open Source em 28 de abril em Kuala Lumpur, para permitir que carteiras móveis e aplicações suportem pagamentos por agentes de IA, colmatando a lacuna já que a maioria dos sistemas existentes ainda depende de redes tradicionais de cartões.
O framework
GateNews12h atrás