Google Lanza Chips de IA Separados para Entrenamiento e Inferencia, Aumentando el Rendimiento 2.8x

Mensaje de Gate News, 23 de abril — Google anunció el 22 de abril que lanzará más adelante este año chips TPU de octava generación separados para entrenamiento e inferencia, reemplazando su diseño combinado anterior. La medida se dirige a cargas de trabajo de agentes de IA y ofrece a los clientes de Google Cloud una alternativa al hardware de Nvidia.

El chip de entrenamiento ofrece 2.8 veces el rendimiento del TPU Ironwood de séptima generación de Google al mismo precio, mientras que el chip de inferencia es 80% más rápido y cuenta con 384 MB de SRAM, el triple de la cantidad en Ironwood. La separación de las capacidades de entrenamiento e inferencia refleja un cambio en la forma en que las empresas optimizan para diferentes demandas computacionales.

La iniciativa está respaldada por una asociación a largo plazo con Broadcom y Anthropic. Anthropic planea utilizar aproximadamente 3.5 gigavatios de cómputo de TPU a través de Broadcom a partir de 2027, y Broadcom se encargará de la fabricación de chips y de los componentes de redes hasta 2031. Anthropic, la startup de IA detrás de Claude, ha visto que sus ingresos anualizados superan recientemente $30 mil millones. Mientras tanto, Apple, Microsoft, Meta y Amazon también están ampliando sus esfuerzos de chips de IA personalizados para reducir la dependencia de Nvidia, que sigue siendo el líder del mercado.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Chrome se vuelve “colega de IA”: tareas de automatización web Auto Browse, suscripción mensual para empresas de 6 dólares

Chrome Enterprise lanza Auto Browse y Chrome Skills impulsados por Gemini, para que el navegador ejecute tareas de varios pasos de forma automática, pero requiere que el usuario haga clic para confirmar; se pueden guardar/compartir flujos de trabajo de IA y se integra con Gmail, calendario y Drive, con control DLP incluido; cuesta 6 USD al mes y se posiciona como convertir el navegador en un compañero de IA.

ChainNewsAbmediaHace26m

OpenAI anuncia los ChatGPT Workspace Agents: impulsados por Codex, compartidos por el equipo, integración con Slack

OpenAI lanzó Workspace Agents en ChatGPT Business/Enterprise/Edu/Teachers el 22 de abril, impulsados por Codex, con ejecución en la nube de larga duración, compartidos por equipos y con capacidad de funcionar sin conexión; pueden responder proactivamente en Slack y emitir tickets, ejecutar flujos de trabajo de múltiples pasos y también admitir la programación. La vista previa de investigación es gratuita hasta el 6 de mayo; después, se cobrará mediante una tarifa basada en créditos, y los precios se darán a conocer. Compiten en el mismo escenario que el GoogleGeminiEnterpriseAgentPlatform y AnthropicClaudeCowork; las tres se centran en agentes a nivel empresarial, pero su posicionamiento es distinto.

ChainNewsAbmediaHace28m

Google Cloud Next 2026: lanza la plataforma de agentes empresariales Gemini, 750 millones de dólares para ayudar a los consultores a implementarlo

Google Cloud anunció en Cloud Next 2026 la plataforma Gemini Enterprise Agent Platform, que integra selección de modelos, construcción de agentes, DevOps, orquestación y controles de seguridad para empresas, y lanzó un fondo de 750 millones de dólares para ayudar a McKinsey, Accenture y Deloitte a implementar agentes empresariales. La plataforma, junto con Ironwood TPU, A2A y MCP, construye su propio stack completo y una vía de acceso para consultores, para hacer frente a OpenAI Operator y a la versión empresarial de Anthropic Claude.

ChainNewsAbmediaHace30m

Google amplía la seguridad en la nube Wiz en AWS, Azure y Google Cloud

Google anunció nuevas funciones de seguridad e integración más profunda de Wiz, la empresa israelí de ciberseguridad que adquirió por US$32 billion, en Google Cloud y plataformas rivales en su evento Cloud Next '26. La compañía presentó tres agentes de IA para las Operaciones de Seguridad en modo de vista previa, diseñados para

CryptoFrontierHace39m

Microsoft invertirá 17,9 mil millones de dólares en Australia en 2029 para infraestructura de IA y nube

Microsoft se compromete con AU$25B para 2029 a expandir la infraestructura de IA y la nube en Australia, a profundizar la defensa cibernética con agencias gubernamentales, a capacitar a 3 millones en IA para 2028 y a coordinar las políticas de centros de datos y de IA para reforzar la soberanía. La expansión de Microsoft de AU$25 mil millones en Australia para 2029 tiene como objetivo aumentar la capacidad local de IA y de nube, basándose en un compromiso previo de AU$5 mil millones. El plan amplía el programa Cyber Shield con el Australian Signals Directorate, capacita a 3 millones de personas en IA para 2028 y se asocia con el Australian AI Safety Institute, mientras formaliza con el gobierno las expectativas de infraestructura de centros de datos y de IA para reforzar la soberanía digital.

GateNewsHace42m

Alibaba Qwen abre servicios de IA a socios externos; China Eastern Airlines, la primera en integrarlos

Alibaba abre sus servicios de IA Qwen a socios externos; China Eastern Airlines se convierte en la primera ajena a Alibaba en implementar un servicio integral de reserva de vuelos con IA, lo que permite a los usuarios solicitar opciones como vuelos directos asequibles o asientos amplios.

GateNewshace1h
Comentar
0/400
Sin comentarios