Mercury 2 da Inception Labs atinge 90% no AIME 2026, superando o DiffusionGemma da Google

Na quinta-feira (18 de junho), a Inception Labs revelou o Mercury 2, afirmando que se trata do modelo de linguagem de raciocínio mais rápido do mundo, gerando aproximadamente 1.000 tokens por segundo. De acordo com o anúncio da empresa, o Mercury 2 obteve 90% no AIME 2026 (American Invitational Mathematics Examination), em comparação com a DiffusionGemma da Google, que marcou 69,1% no mesmo benchmark. O modelo também alcançou 77% no GPQA, um benchmark científico no nível de doutorado. A Augment Code, uma empresa de agentes de codificação com IA, informou uma redução de 82% na latência e um corte de 90% nos custos após substituir o Mercury 2 pela Claude Opus 4.7, da Anthropic, mantendo a qualidade da saída.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários