Ingenieros de Ant analizaron el código fuente de Claude, revelando el mecanismo de la línea de decisión de cuatro niveles en el modo automático

Noticias de Gate News, el 25 de marzo, ingenieros de Ant Group, autores del framework frontend Umi.js, realizaron ingeniería inversa del código fuente de Claude Code 2.1.81 y restauraron completamente el mecanismo de decisión en Modo Automático. El hallazgo principal: cada llamada a herramienta pasa por una línea de cuatro decisiones, y solo cuando las tres primeras no puedan determinar, se invoca un clasificador de IA independiente para la revisión de seguridad.

La línea de decisiones consta de cuatro niveles: el primero verifica las reglas de permisos existentes, y si hay una coincidencia, se permite directamente; el segundo simula el modo acceptEdits (permiso para editar archivos), y si en este modo se aprueba, indica un riesgo muy bajo y se omite el clasificador; el tercero revisa la lista blanca de herramientas de solo lectura (Read, Grep, Glob, LSP, WebSearch, etc.), que no modifican ningún estado y se permiten sin condiciones; si ninguna de estas condiciones se cumple, se pasa al cuarto nivel, que envía una solicitud API independiente a Claude Sonnet para clasificación de seguridad.

Los detalles clave del diseño del clasificador incluyen: usar siempre Sonnet en lugar de Opus, como un equilibrio entre costo y latencia; establecer la temperatura en 0 para garantizar resultados deterministas; el clasificador se define como un «monitor de seguridad para agentes autónomos de programación IA», protegiendo contra tres tipos de riesgos (inyección de prompts, propagación de alcance, daños accidentales); el archivo de configuración CLAUDE.md del usuario se inyecta en el contexto del clasificador, sirviendo como base para interpretar la intención del usuario.

Las reglas de bloqueo cubren más de 22 categorías, incluyendo force push, push directo a la rama main, descarga y ejecución de código externo, despliegue en producción, fuga de datos, modificación de permisos, creación de vectores de ejecución remota, filtración de credenciales, etc. Las excepciones de permiso incluyen 7 tipos: claves codificadas de prueba, operaciones con archivos locales en el directorio de trabajo, solicitudes GET de solo lectura, instalación de dependencias declaradas, instalación de herramientas oficiales, lectura de credenciales de configuración enviadas al proveedor objetivo, y push a la rama de trabajo actual.

El sistema también implementa un mecanismo de corte: después de 3 rechazos consecutivos o 20 rechazos acumulados, el sistema pasa a modo de confirmación manual; en modo headless, se detiene directamente el agente. Cuando el clasificador no está disponible, una bandera de función controla si el sistema opera en modo «fail-closed» (rechazo directo) o «fail-open» (degradación a confirmación manual).

En modo Automático, la inyección de palabras clave de comportamiento tiene un control de frecuencia preciso: se inyecta cada 5 turnos de diálogo, y en cada ciclo de 5 inyecciones, la primera es la versión completa (aproximadamente 800 palabras, incluyendo instrucciones como «ejecutar inmediatamente, reducir interrupciones, acción sobre planificación» y otras seis directrices), mientras que las otras 4 son versiones resumidas en una línea, equilibrando el uso del espacio en la ventana de contexto y la estabilidad del comportamiento.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Banco Central de Brasil: Las stablecoins dominan las compras de criptomonedas por más de $6.9 mil millones registradas en el 1T

Según los datos divulgados por el Banco Central de Brasil, las compras de stablecoins representaron 6.800 millones de dólares de los 6.900 millones de dólares en criptomonedas compradas en el extranjero por brasileños durante el primer trimestre (Q1). Esto representa un aumento de más del 100% en comparación con el mismo período del año pasado. Ideas clave: El Banco Central de Brasil

CoinpediaHace46m

Los stablecoins surgen como infraestructura financiera central, y se aceleran las tendencias de localización: informe de a16z

Mensaje de Gate News, 26 de abril — Según un informe de los investigadores de cripto de a16z Robert Hackett y Jeremy Zhang, los stablecoins están evolucionando desde instrumentos de trading en etapas iniciales y vehículos de ahorro hacia una infraestructura financiera central. La Ley U.S. GENIUS Act ha

GateNewshace7h

79% de los cajeros automáticos globales de cripto ubicados en Estados Unidos

Mensaje de Gate News, 25 de abril — Según Cointelegraph, el 79% de los cajeros automáticos de criptomonedas del mundo están ubicados en Estados Unidos.

GateNewshace15h

Informe de tendencias del ETF de JPMorgan: API, asignación activa del 83%, y tokenización dividida en dos rutas: sintética y nativa

El informe de JPMorgan señala tres tendencias principales: 1) el comercio automatizado mediante APIs de AP representa aproximadamente el 50% del flujo de la primera capa del mercado; 2) en 2025, los ETF activos representarán el 83% de las nuevas emisiones, y se espera que en 2026–27 se conviertan en la corriente principal; 3) la tokenización se divide en dos rutas: sintética (que replica precios mediante derivados) y nativa (que se emite en una blockchain). El informe enfatiza mejorar la transparencia y la gobernanza con herramientas como Athena, y observa la evolución posterior y los plazos de la comercialización formal.

ChainNewsAbmediahace18h

Informe de a16z: Las stablecoins alcanzan $4,5 billones en transacciones del 1T, con cambio hacia pagos locales

Mensaje de Gate News, 25 de abril — Según un nuevo informe de a16z, las stablecoins han evolucionado de herramientas de liquidación cripto a infraestructura financiera global, con una adopción que se acelera en Asia, Brasil y otros mercados emergentes. El cambio de enfoque ha pasado del pago transfronterizo a los pagos locales a medida que la claridad regulatoria y el mejor rendimiento de la blockchain permiten una integración más amplia en el mundo real.

GateNews04-25 07:11

Rescate de vulnerabilidad de Kelp DAO: Mantle prepara la versión tokenizada de Aave 3 millones de ETH, el consorcio DeFi promete más de 43.500 ETH

Kelp DAO 跨鏈橋遭駭後,DeFi United 集結 Aave 等協議承諾動用 43,500 ETH(約 1.01 億美金)救濟壞帳。Mantle 提出 MIP-34,最高借出 30,000 ETH 給 Aave DAO,授予 130,000 AAVE 投票權;Stani Kulechov 個人注資 5,000 ETH,Lido 等亦出資。此舉被視為危機下的「貸款換治理權」實驗,尚待投票。

ChainNewsAbmedia04-24 15:28
Comentar
0/400
Sin comentarios