MemoriasTutoriales

HBM2 vs HBM3: COMPARATIVA de RENDIMIENTO

Ya llega la nueva generación de HBM, y la batalla HBM2 vs HBM3 está servida. Si quieres conocer algo más sobre estas dos revisiones de la memoria, te invito a seguir leyendo este artículo donde veremos tanto qué es la memoria HBM y también analizaremos las novedades de la HBM3 y las ventajas frente a la HBM2.

¿Qué es la memoria HBM?

caracteristica memorias hbm

Como su nombre indica, y se presenta en este documento, la memoria HBM ofrece un mayor ancho de banda de memoria. La memoria utiliza arquitecturas de interfaz amplia para lograr operaciones de alta velocidad y bajo consumo. La DRAM HBM está estrechamente acoplada al troquel de computación del host mediante una interfaz distribuida. Normalmente, las pilas de una memoria HBM se componen de cuatro troqueles de 4DRAM apilados en troqueles de un solo núcleo.

Una pila de cuatro troqueles (4-Hi) en la memoria de gran ancho de banda tiene dos canales con 256 bits cada troquel, lo que hace un total de ocho canales con 1024 bits de ancho. Los chips de memoria de gran ancho de banda (HBM) son de tamaño reducido si se comparan con la memoria GDDR (Graphics Double Data Rate), para la que fueron diseñados inicialmente. La memoria de alto ancho de banda (HBM) es una interfaz de memoria de alta velocidad para la memoria dinámica sincrónica de acceso aleatorio en pila (SDRAM), fabricada inicialmente por Samsung, AMD y SK Hynix. En Hot Chips de agosto de 2016, tanto Samsung como SK Hynix anunciaron la tecnología de memoria de próxima generación, High Bandwidth Memory.

Para ayudar a AMD con su visión de la HBM, han traído a socios de la industria de la memoria, especialmente la firma coreana SK Hynix, que tiene experiencia previa en la memoria apilada en 3D, y socios de la industria de los interpositores (la firma taiwanesa UMC) y de la industria del embalaje (Amkor Technology y ASE). HBM son las siglas de High Bandwidth Memory (memoria de alto ancho de banda), y es el tipo de interfaz de memoria que se utiliza en la DRAM (memoria dinámica de acceso aleatorio) apilada en 3D que se encuentra en algunas GPU (también conocidas como tarjetas gráficas) de AMD, y también en los espacios de servidor, computación de alto rendimiento (HPC), y red y cliente. En definitiva, la HBM está pensada para proporcionar mucho más ancho de banda y un menor consumo de energía que la memoria GDDR utilizada en la mayoría de las buenas tarjetas gráficas actuales para juegos. En comparación con la memoria RAM DDR convencional, la HBM, con sus datos de 128 bits de ancho por canal, ofrece un ancho de banda mucho mayor, de unos 256 GB/s por 8 canales por troquel.

La memoria HBM es superior en términos de rendimiento y eficiencia energética en comparación con la GDDR5 que se utilizaba anteriormente, lo que supone la oportunidad de un mercado creciente de memoria de gran ancho de banda. Las características de gran ancho de banda y baja latencia dictan que la HBM es muy adecuada como memoria para la GPU, ya que los juegos y los procesos gráficos son tareas muy predecibles y de alta concurrencia en sí mismas. En resumen, un gran ancho de banda de la memoria es fundamental para mantener abastecidos de datos a los múltiples dispositivos del sistema, así como a las unidades de cálculo por núcleo. Incluso con las tasas relativamente altas de DDR y GDDR, numerosos algoritmos de IA y redes neuronales se topan repetidamente con limitaciones de ancho de banda de memoria.

Algunos jugadores deberían saber que la HBM es una memoria de mayor velocidad que tiene un ancho de banda muy superior al de la DDR/GDDR. La HBM ofrece una solución no sólo a ese muro de ancho de banda de la memoria, sino que también, gracias a la proximidad de las capas del interposer y a la arquitectura 3D, ofrece mayores rendimientos y factores de forma reducidos, respectivamente.

Características de la HBM2

La segunda generación de memoria de gran ancho de banda, HBM2, también especifica hasta ocho troqueles por pila, y transferencias de doble pin a velocidades de hasta 2 GT/s.

El estándar HBM2 permite 3,2 GBps por pin, un máximo de 24 GB por pila (2 GB por troquel sobre 12 troqueles por pila), y un rendimiento máximo de 410 GBps entregado sobre una interfaz de memoria de 1024 bits separada por 8 canales únicos en cada pila. Cada pila de HBM2 tiene una interfaz más amplia y dedicada de 1.024 bits, lo que permite que los dispositivos de memoria funcionen a velocidades de reloj comparativamente más bajas, pero sin dejar de ofrecer un rendimiento masivo. La interfaz de memoria tiene una anchura de 1024 bits, lo que podría dar lugar a un ancho de banda de memoria de 256 GB/s en una sola pila. La HBM2, por su parte, tiene la ventaja de tener una latencia más baja, lo que la hace perfecta para CPUs de servidores con docenas de núcleos, pero no para una tarjeta gráfica, y tiene hasta 8 canales de memoria diferentes, uno por chip.

Esto es menos cierto en el caso de la GDDR6, gracias a su mayor capacidad de ancho de banda, pero sigue habiendo casos de uso en los que la HBM2 tiene ventaja.

En cuanto a los avances, se esperaba que la HBM2 ofreciera mayores velocidades de memoria, además de un mayor ancho de banda. Por supuesto, la HBM2 es más capaz de escalar a lo largo de un gran número de pilas que la GDDR6 a lo largo del ancho del bus, lo que hace que las topologías más grandes de la HBM2 estén muy por delante de los chips de memoria independientes de la GDDR6 en términos de ancho de banda. A modo de comparación, un bus de memoria GDDR6 de 256 bits de ancho que funcione a 14 Gbps podría alcanzar un ancho de banda total de 448 GB/s; por tanto, una pila individual de HBM2 se queda un poco atrás. Aunque es más lenta que la HBM2 en cuanto al ancho de banda de la memoria, la GDDR6 es mucho más barata que la HBM2, lo que la convierte en una buena opción para las tarjetas gráficas convencionales, y ésta es la razón por la que AMD cambió a la GDDR6 en sus GPU NAVI después de utilizar HBM y HBM2 en sus tarjetas gráficas de las series FURY y VEGA.

HBM mejoradas

La High Bandwidth Memory tiene varias mejoras disponibles en el mercado que han ido surgiendo con el tiempo, que son:

  • HBM2E: presentada a finales de 2018 por JEDEC como una actualización de la HBM2 que tendrá mayor capacidad y ancho de banda. Concretamente admite hasta 307 GB/s por pila, o lo que es lo mismo, 2.5 Tbit/s.
  • HBMnext: a finales de 2020 Micron presentó una actualización del HBM2E conocida como HBMnext, otro estándar que originalmente fue propuesto como HBM3.
  • HBM-PIM: fue presentada a comienzos de 2021 por Samsung. Un nuevo desarrollo con capacidades de computación de IA dentro de la propia memoria, aumentando así el procesamiento de datos a gran escala gracias a los motores IA integrados en la DRAM.

Características de la HBM3

El subsistema de memoria RAMBUS HBM3 admite una velocidad de datos de hasta 8,4 Gbps por pin de datos. Con múltiples canales de memoria, HBM3 es capaz de soportar mayores pilas de DRAM por troquel, así como accesos de mayor granularidad. La interfaz de memoria sigue siendo de 1.024 bits de ancho, y una sola pila de HBM3 puede ofrecer un rendimiento de 819 GB/seg.

Una pila de 12 dispositivos de 32 Gb de altura da como resultado un dispositivo DRAM HBM3 de 48 GB. Dividido entre 8 bits/1 byte, el ancho de banda posible entre el procesador anfitrión y los dispositivos DRAM HBM3 individuales es de 819 gigabytes por segundo (GB/s). Los dispositivos de memoria HBM3 admiten velocidades de transmisión de datos de 6,4 GT/s, por lo que una sola pila de memoria de alto ancho de banda puede ofrecer hasta 819 GB/s.

En el futuro, desde el punto de vista de la capacidad, esperamos que la memoria HBM3 de primera generación se parezca mucho a su homóloga de la generación actual, la memoria HBM2E. Al ofrecer 8-Hi y 12-Hi apilados, respectivamente, esto significa que, al menos para SK Hynix, la memoria HBM3 de primera generación sigue teniendo una densidad idéntica a la de su memoria HBM2E de última generación. Según Ryan Smith de Anandtech, la memoria HBM3 de primera generación de SK Hynix tiene la misma densidad que la memoria HBM2E de última generación de SK Hynix, lo que significa que los vendedores de dispositivos que quieran aumentar la capacidad de almacenamiento general de sus piezas de próxima generación tendrán que utilizar una memoria de 12 capas por troquel, en comparación con las pilas de 8 capas que han utilizado generalmente hasta ahora. Según el JEDEC, hay una gama más amplia de densidades disponibles, que van desde los 4 GB (8 Gb de altura) hasta los 64 GB (32 Gb de altura), y se espera que los dispositivos de memoria HBM3 de primera generación se basen en capas de memoria de 16 Gb.

El estándar HBM3 está diseñado para ofrecer un mayor rendimiento, el doble de datos por pin que las piezas de la generación HBM2, hasta 6,4Gbps, lo que equivale a un ancho de banda de 819Gbps por dispositivo, según el JEDEC, lo que corresponde al diseño de DRAM HBM3 de SK Hynix anunciado el año pasado. El ancho de banda de la memoria es un factor clave para el rendimiento informático, por lo que es necesario acelerar la evolución de los estándares, y HBM3 representa una nueva referencia. Con las tasas de datos que SK Hynix afirma, eso significa que una sola pila de HBM3 sería capaz de alcanzar un ancho de banda de memoria de 819 GB/segundo. SK Hynix va a proporcionar su propia memoria HBM3 ultrarrápida.

HBM2 vs HBM3

Por último, para ver las diferencias de HBM2 vs HBM3, te muestro esta tabla con todas ellas resumidas:

Comparativa HBM
Especificaciones HBM1 HBM2 HBM3
Densidad por troquel 2 GB 8 GB 16 GB
Velocidad máxima por pin 1 Gbps 2 Gbps 6.4 Gbps
Nº de chips apilados 4 2/4/8 4/8/12/16
Ancho de banda por chip 128 GB/s 256 GB/s 819 GB/s
E/S interface CMOS CMOS Interfaz de bajo voltaje
Consumo Menor que la GDDR5 y GDDR5X Menor que la HBM
Fabricantes Hynix, Samsung, Nvidia Samsung, Hynix Samsung, Hynix,…
Apariencia Cubo Cubo Cubo
Usado en estos modelos de tarjetas gráficas Radeon R9, Fury X, Radeon Pro Duo Nvidia Tesla P100, Nvidia Quadro GP100, Radeon Rx Vega 56, Radeon Rx Vega 64, Nvidia Titan V, AMD Radeon VII

Te recomendamos la lectura de las mejores tarjetas gráficas del mercado. Y ahora ya conoces un poco más sobre la memoria HBM. ¡No olvides comentar!

Isaac Romero Torres

Más de una década trabajando en el ámbito de la investigación sobre arquitecturas y microarquitecturas de CPUs, de la electrónica, la lógica digital, de los sistemas operativos Unix (con los que trabajé como asesor para algunas empresas), programación de MCUs, PLCs, hacking, etc.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en info@profesionalreview.com
Botón volver arriba