Procesadores

Groq gana terreno en inferencia al prometer menos coste por token y más velocidad que NVIDIA Blackwell

Un experto de Nebius asegura que los chips de Groq ya resultan más baratos y rápidos que Blackwell en inferencia

La carrera por la infraestructura de inteligencia artificial está empezando a cambiar de métrica. Ya no se trata solo de cuánto cuesta una GPU por hora, sino de cuánto cuesta generar resultados útiles a escala. En ese cambio de enfoque, Groq está ganando visibilidad como una de las alternativas más serias a NVIDIA en inferencia, al menos según un experto de Nebius citado por AlphaSense y recogido por wccftech.

La comparación parte de una idea cada vez más repetida en el sector. En la empresa, entre el 90 % y el 95 % de la demanda ya no estaría en entrenamiento, sino en inferencia. Es decir, en servir modelos ya entrenados a clientes, empleados o productos reales. Y ahí el indicador empieza a ser el coste por millón de tokens, no tanto la potencia bruta del hardware ni el precio horario de una GPU concreta.

Chips de Groq con inferencia más barata y más rápida, pero para un trabajo distinto

Según esa lectura, los chips de Groq estarían moviéndose entre cinco y diez céntimos por millón de tokens, frente a unos 25 céntimos en sistemas basados en Blackwell. Además, el experto sostiene que Groq puede alcanzar hasta 800 tokens por segundo, frente a unos 450 tokens por segundo en la plataforma de NVIDIA. Si se toma esa comparación al pie de la letra, la ventaja sería clara en coste y también en velocidad de respuesta.

Eso no significa que Groq haya destronado a NVIDIA en todos los frentes. Blackwell sigue ocupando una posición privilegiada en entrenamiento pesado y grandes despliegues empresariales. Además, NVIDIA conserva una ventaja enorme en ecosistema, software y cuota de mercado. Pero el crecimiento de este tipo de alternativas sí confirma que la industria está empezando a aceptar que no todo requiere la misma clase de acelerador. Para ciertas cargas, sobre todo de inferencia a gran escala, importa más el rendimiento económico real que la ficha técnica tradicional.

La lectura es coherente con el mensaje que la propia NVIDIA lleva semanas impulsando al hablar de coste por token como métrica clave. El problema para la compañía es que, si el debate se desplaza definitivamente a ese terreno, también abre espacio para que otros competidores presuman de eficiencia específica en inferencia.

Te interesa 👉 Los mejores portátiles para IA

Por ahora no estamos ante una sustitución masiva del dominio de NVIDIA, pero sí ante una nueva fase del mercado. Parece que a partir de ahora no siempre ganará quien tenga el chip más potente, sino quien consiga entregar más tokens por menos dinero.

Siguiente Lo mejor de este monitor gaming 4K no es que sea OLED ni que esté a precio mínimo: es el sistema de luces que incluye »

Anterior « Los Mac Studio con M3 Ultra se disparan en reventa hasta 25.000 dólares por la escasez de stock

ATI a AMD: 20 años de la compra de 5.400 millones de dólares que cambió la industria

El 24 de julio de 2006, AMD hizo uno de los anuncios más importantes en…

22 horas atrás

Noticias

MSI PRO MAX EDGE AI+: potencia de IA en un chasis compacto de 4 litros y Ryzen AI Max+ 300

MSI ha lanzado oficialmente al mercado el mini PC PRO MAX EDGE AI+ 11M, un…

23 horas atrás

Noticias

AMD se alía con Samsung para conseguir memoria HBM4 y competir Rubin de Nvidia

AMD ha dado un paso decisivo al recurrir a Samsung como uno de sus proveedores…

1 día atrás