Arm ha dado el paso y presenta Lumex, su plataforma de subsistema de cómputo (CSS) más ambiciosa hasta la fecha, pensada para impulsar la IA en el propio dispositivo tanto en móviles de gama alta como en ordenadores de nueva generación.
La propuesta combina bloques de hardware y software listos para integrarse en un SoC: nuevas CPU Arm C1 con SME2, GPU Mali G1, interconexión y una pila de desarrollo optimizada, con el fin de habilitar experiencias como traducción en tiempo real, asistentes más contextuales y juegos con gráficos avanzados sin depender constantemente de la nube.
Qué es Lumex y qué cambia frente a otras plataformas
Más allá de un conjunto de IP sueltas, Lumex es un subsistema de referencia listo para 3 nm que los fabricantes pueden adoptar tal cual o configurar a medida, reduciendo tiempos de integración y asegurando rendimiento desde el primer silicio.
Arm estrena además una nomenclatura renovada para sus bloques: la familia de CPU pasa a C1 (con C1-Ultra, C1-Premium, C1-Pro y C1-Nano) y la GPU a Mali G1 (G1-Ultra, G1-Premium y G1-Pro), con SME2 como gran baza para acelerar la IA en la CPU.
CPU Arm C1: arquitectura, SME2 y salto de rendimiento
El clúster Arm C1 está diseñado sobre Armv9.3 y puede escalar hasta 14 núcleos, con soporte para LPDDR6 (manteniendo compatibilidad con LPDDR5X). La interconexión C1-DSU coordina los núcleos bajo una caché L3 compartida y añade mejoras de eficiencia frente a la generación previa.
Las instrucciones SME2 son obligatorias en C1-Ultra y C1-Premium y opcionales en C1-Pro y C1-Nano, permitiendo multiplicar el rendimiento en cargas de IA en la CPU sin los costes de mover datos a otros aceleradores.
Según Arm, un clúster C1 con SME2 ofrece hasta 5 veces más rendimiento en IA, reduce la latencia de voz hasta 4,7 veces y acelera la generación de audio 2,8 veces respecto a la generación anterior.
Más allá de la IA, la nueva arquitectura aporta un 15% de mejora media en usos cotidianos, hasta un 30% en cargas exigentes y picos de 45% en multinúcleo, ayudada por optimizaciones en front-end, predicción y ventanas de ejecución fuera de orden.
GPU Mali G1: más ray tracing y mejoras en IA
La Mali G1-Ultra introduce una unidad de trazado de rayos de nueva generación (RTUv2) y promete el doble de rendimiento en ray tracing frente a la anterior, junto con un 20% más de rendimiento gráfico y 9% menos energÃa por fotograma.
En IA/ML, la GPU añade rutas FP16 para multiplicación de matrices y consigue hasta un 20% más de inferencia, mejorando tareas como reconocimiento del habla, segmentación semántica o mejora de imagen frente a la generación previa.
La familia se completa con G1-Premium (6–9 núcleos, sin ray tracing) y G1-Pro (1–5 núcleos), en una arquitectura escalable que dobla la red interna y las zonas de caché para reducir congestión y aumentar el ancho de banda.
Software y ecosistema: KleidiAI y soporte en frameworks
La plataforma acompaña el hardware con una pila pensada para que los desarrolladores aprovechen SME2 y Mali G1 sin cambios profundos en sus apps: KleidiAI se integra con ExecuTorch (PyTorch), ONNX Runtime y Google LiteRT, entre otros.
Arm trabaja además con Android 16, Linux y motores como Unity y Unreal para que las optimizaciones de IA y gráficos lleguen de forma automática a juegos y aplicaciones compatibles.
Lumex CSS para SoC a 3 nm: integración y telemetrÃa
El paquete CSS incluye diseños fÃsicos listos para 3 nm en los principales nodos, con perfiles de potencia/rendimiento/área ya validados, lo que acorta el «time-to-market» y minimiza riesgos en el tape-out.
Se añaden herramientas de telemetrÃa y una plataforma de referencia para facilitar la puesta a punto por modelo, asà como la flexibilidad del C1-DSU para adaptar clústeres y aceleradores a cada segmento.
Adopción: objetivos y dispositivos de destino
Arm planea llevar esta tecnologÃa a 3.000 millones de dispositivos a lo largo del ciclo, con una capacidad agregada de cómputo de IA que supera los 10.000 millones de TOPS entre todos ellos, dejando a los socios la libertad de integración según producto.
En la práctica, veremos móviles Android con funciones de IA locales más rápidas, portátiles basados en Arm que aprovechen SME2 y GPU renovada, y diseños que prioricen eficiencia o prestaciones en función del mercado.
Con Lumex, Arm intenta acelerar el salto a una IA útil, privada y con baja latencia en el dispositivo, apoyándose en CPU C1 con SME2, GPU Mali G1 y una base CSS lista para 3 nm; una combinación que apunta a mejor rendimiento y menos consumo sin sacrificar la flexibilidad que demandan los fabricantes.