Anthropic Identifica Três Alterações na Camada de Produto por Detrás da Queda da Qualidade do Claude Code, e Não um Problema do Modelo

Mensagem do Gate News, 23 de abril — A equipa de engenharia da Anthropic confirmou que a degradação da qualidade do Claude Code reportada pelos utilizadores ao longo do último mês resultou de três alterações independentes na camada de produto, e não de problemas na API ou no modelo subjacente. Os três problemas foram corrigidos a 7 de abril, 10 de abril e 20 de abril, respetivamente, com a versão final agora na v2.1.116.

A primeira alteração ocorreu a 4 de março, quando a equipa reduziu o nível de esforço de raciocínio predefinido do Claude Code de “high” para “medium” para abordar picos ocasionais e extremos de latência no Opus 4.6 sob elevada intensidade de raciocínio. Após reclamações generalizadas de utilizadores sobre desempenho reduzido, a equipa reverteu a alteração em 7 de abril. O valor predefinido atual é agora “xhigh” para o Opus 4.7 e “high” para outros modelos.

O segundo problema foi um bug introduzido a 26 de março. O sistema foi concebido para limpar registos antigos de raciocínio após a inatividade na conversa exceder uma hora, de modo a reduzir os custos de recuperação da sessão. No entanto, uma falha na implementação fez com que a limpeza fosse executada repetidamente em cada turno subsequente em vez de uma única vez, levando o modelo a perder progressivamente o contexto de raciocínio anterior. Isso manifestou-se como aumento de esquecimento, operações repetidas e invocações anormais de ferramentas. O bug também resultou em faltas de cache em cada pedido, acelerando o consumo das quotas dos utilizadores. Dois testes internos não relacionados mascararam as condições de reprodução, alargando o processo de depuração para mais de uma semana. Após a correção em 10 de abril, a equipa analisou código problemático usando o Opus 4.7 e verificou que o Opus 4.7 conseguia identificar o bug, enquanto o Opus 4.6 não conseguia.

A terceira alteração foi lançada a 16 de abril em conjunto com o Opus 4.7. A equipa adicionou instruções ao prompt do sistema para reduzir a saída redundante. Testes internos ao longo de várias semanas não mostraram regressão, mas após o lançamento, a interação com outros prompts degradou a qualidade da codificação. Uma avaliação alargada revelou uma queda de 3% no desempenho tanto no Opus 4.6 como no 4.7, levando a uma reversão a 20 de abril.

Estas três alterações afetaram grupos de utilizadores diferentes em momentos diferentes, e o efeito combinado criou uma queda de qualidade generalizada e inconsistente, dificultando o diagnóstico. A Anthropic afirmou que agora será necessário envolver mais funcionários internos para utilizarem a mesma versão pública de compilação que os utilizadores, executarem conjuntos completos de avaliação do modelo para cada modificação de prompt do sistema e implementarem períodos de rollout faseado. Como compensação, a Anthropic repôs as quotas de utilização de todos os utilizadores com subscrição.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Cognition AI Angaria Financiamento a $25B Avaliação em Negociações Iniciais

Mensagem de Gate News, 24 de Abril — A Cognition AI, uma startup de programação com IA, está em negociações iniciais para uma nova ronda de financiamento que, segundo fontes familiarizadas com o assunto, mais do que duplicaria a sua avaliação para $25 bilião. A empresa pretende angariar centenas de milhões de dólares ou mais, na medida em que

GateNews42m atrás

A NEC Corporation tornar-se-á o primeiro parceiro global da Anthropic no Japão

A NEC anunciou que se tornará o primeiro parceiro global da Anthropic no Japão, com ambas as partes a desenvolver soluções de IA seguras e com conhecimento específico do setor para indústrias altamente reguladas, como as finanças, a indústria transformadora e os governos locais, e a integrar a série Claude na NEC BluStellar, com foco na transformação da gestão orientada por dados e da experiência do cliente. Em simultâneo, será introduzido o Claude Cowork e a integração com o SOC para melhorar a proteção de cibersegurança. Para validar a eficácia, a NEC lançou o Programa do Cliente Zero para testes internos e abrangentes de agentes de IA, e planeia promover a implementação do Claude a nível global, criando o maior CoE (Centro de Excelência) de Engenheiros de IA native no Japão.

ChainNewsAbmedia3h atrás

Incumprimento de Segurança da Vercel Expande-se para Centenas de Utilizadores; Desenvolvedores de IA em Maior Risco

Mensagem do Gate News, 23 de abril — A Vercel divulgou a 19 de abril que o seu incidente de segurança, inicialmente descrito como afetando um "conjunto limitado de clientes", se expandiu para uma comunidade de programadores muito mais vasta, em particular aqueles que criam fluxos de trabalho de agentes de IA. O ataque pode afetar centenas de utilizadores

GateNews4h atrás

OpenAI lança o GPT-5.5: 12M de contexto, o índice AA atinge o topo, o Terminal-Bench reescreve a referência de agentes com 82,7%

A OpenAI anunciou o GPT-5.5, com destaque para trabalho orientado por agentes e processamento de conhecimento empresarial, e disponibilizou-o em simultâneo no ChatGPT e no Codex. Os pontos principais incluem uma janela de contexto de 12 milhões de tokens, AA Intelligence Index 60, superando o Claude Opus 4.7 e o Gemini 3.1 Pro; o preço é de 5 dólares por cada milhão de tokens de entrada e 30 dólares por cada milhão de tokens de saída, com uma redução de cerca de 40% nos tokens de saída e um aumento de cerca de 20% no custo real.

ChainNewsAbmedia5h atrás

Cluster Protocol angaria $5M para acelerar o CodeXero, um IDE de IA nativo do browser para EVM

Mensagem de Gate News, 23 de abril — A Cluster Protocol, uma empresa de infraestruturas Web3 e deeptech em IA, anunciou que angariou $5 milhões numa nova ronda de financiamento liderada pela DAO5, com participação da Paper Ventures, JPEG Trading e Mapleblock Capital, elevando o financiamento total para 7,75 milhões de dólares. O capital vai

GateNews5h atrás

Nvidia alarga parcerias de IA no Reino Unido, na China e no sector automóvel perante desafios na cadeia de abastecimento

Mensagem do Gate News, 23 de abril — Apesar da concorrência da Google e das perturbações na cadeia de abastecimento, a Nvidia continua a ser o interveniente dominante no hardware de IA. A TD Cowen reafirmou na quinta-feira a sua classificação de compra para a Nvidia, citando a liderança da empresa em desempenho e na amplitude do ecossistema de software. O aval

GateNews5h atrás
Comentar
0/400
Nenhum comentário