NoticiasTarjetas gráficas

Instinct MI355X: Por primera vez una solución de AMD supera el millón de tokens

AMD ha demostrado el potencial de su arquitectura CDNA 4 durante las pruebas de MLPerf Inference 6.0. Por primera vez, una solución de AMD ha superado la impresionante marca de un millón de tokens por segundo con una aceleradora AMD Instinct MI355X.

Instinct MI355X supera el millón de tokens por segundo en MLPerf 6.0

AMD Instinct MI355X

Este logro se alcanzó utilizando un clúster multinodo equipado con GPUs MI355X para procesar modelos de lenguaje de gran escala (LLM), como Llama 2 de 70 mil millones de parámetros. En configuraciones de 12 nodos, el sistema entregó exactamente 1.031.070 tokens por segundo en el escenario Offline.

Lo más destacable no es solo esta cifra, sino la eficiencia del escalado. AMD reportó una eficiencia superior al 92%, lo que significa que el rendimiento aumenta de manera casi lineal a medida que se añaden más nodos, una característica que es esencial para las empresas que despliegan servicios de IA generativa a gran escala.

AMD Instinct MI355X

Te recomendamos nuestra guía sobre las mejores tarjetas gráficas del mercado

CDNA 4 y HBM3E

AMD Instinct MI355X

Este rendimiento es posible gracias a la cuarta arquitectura CDNA. La aceleradora Instinct MI355X está equipada con una capacidad de memoria de 288 GB de HBM3E, ofreciendo un ancho de banda de hasta 8 TB/s. Además, la GPU introduce soporte para nuevos tipos de datos de baja precisión, como MXFP4 y MXFP6, que permiten triplicar el rendimiento en comparación con la generación anterior (MI325X) manteniendo la precisión necesaria para la inferencia de la IA.

AMD Instinct MI355X

Con estos resultados, AMD no solo demuestra que su hardware es competitivo, sino que su ecosistema de software ROCm ha madurado lo suficiente como para poder trabajar eficientemente con distintos nodos al unísono y escalar el rendimiento como debería. Os mantendremos informados.

Fuente
techpowerup

Gustavo Gamarra

Soy operador de PC e instalador de redes informáticas , redactor y escritor en mis ratos libres. Amante de la tecnología, el cine, el fútbol y los videojuegos.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en info@profesionalreview.com
Botón volver arriba