Portátiles y ordenadoresTutoriales

Qué es la lista Top500 de las supercomputadoras

Seguramente que has escuchado algo sobre la lista Top500. Pues bien, en este artículo te vamos a contar todo lo que debes saber sobre esta famosa lista que se encarga de clasificar todos los años a las 500 supercomputadoras (HPC) más potentes del mundo.

¿Qué es el Top500?

supercomputador

Este proyecto surge para clasificar las 500 supercomputadoras más potentes del mundo, de ahí su nombre Top500. La primera vez que se hizo fue en 1993, y desde entonces publica una lista actualizada dos veces al año. La primera se realiza en junio y la segunda en noviembre. No son fechas elegidas por casualidad, ya que la de junio se presenta en la International Supercomputing Conference y la de noviembre se hace en la ACM/IEEE Supercomputing Conference.

Cualquier persona interesada en conocer estas listas y todos los detalles, puede acceder de forma gratuita desde su portal oficial top500.org. Además, debes saber que este proyecto no solo sirve para que los países saquen músculo y presuman de poder computacional, también es una forma de rastrear y hacer un seguimiento de las tendencias de HPC.

En cuanto a la confesión de las listas, las realizan un grupo de expertos y se basa en las clasificaciones HPL, es decir, una implementación portable del banco de pruebas LINPACK de alto rendimiento. Este benchmark está escrito en lenguaje de programación Fortran y se puede ejecutar en sistemas de memoria distribuida.

La lista número 60, la última en actualizarse al momento de escribir este artículo, se realizó en noviembre de 2022. Hasta junio de 2023 no habrá otra actualizada.

Aunque la lista se realiza en multitud de países de todo el mundo, el líder indiscutible en supercomputadoras instaladas era Estados Unidos, que cuenta con casi el 50% del total de las 500 máquinas analizadas por el momento. En segunda posición estaba China, que actualmente se ha puesto líder, siendo el primer país en la historia que supera a EE.UU. Mientras que otros países se reparten el resto. Dentro de Europa, Alemania es el país mejor posicionado, en tercer lugar, con más de 30 supercomputadoras, seguido muy de cerca por Japón. Y si te preguntas por España, el más potente de los que tenemos aquí y el único que entra en la lista Top500 es el Marenostrum instalado en el BSC de Barcelona.

Marenostrum

No obstante, en España existe la RES (Red Española de Supercomputación), y que se compone por varios supercomputadores repartidos por toda la geografía española e interconectados entre sí:

  • Barcelona Supercomputing Center (BSC) – Centro Nacional de Supercomputación (CNS) en Barcelona. Al ser el más potente, actúa como coordinador de los demás.
  • BIFI de la Universidad de Zaragoza.
  • PICASSO de la Universidad de Málaga.
  • NASERTIC de Navarra.
  • CETA del CIEMAT (Centro de Investigaciones Energéticas, Medioambientales y Tecnológicas) en Madrid.
  • Altamira de la Universidad de Cantabria.
  • Tirant de la Universidad de Valencia.
  • Universidad Autónoma de Madrid.
  • Instituto de Astrofísica de Canarias.
  • FinisTerrae del Centro de Supercomputación de Galicia.
  • Centro de Supercomputación de Castilla y León.
  • Centro de Supercomputación de Extremadura.
  • Consorcio de Servicios Universitarios de Catalunya.
  • Port d’Informació Científica PIC.
País o territorio Sistemas
China 162
Estados Unidos 127
Alemania 34
Japón 31
Francia 24
Reino Unido 15
Canadá 10
Corea del Sur 8
Brasil 8
Países Bajos 8
Italia 7
Rusia 7
Arabia Saudí 6
Suecia 6
Australia 5
Irlanda 5
Suiza 4
Singapur 3
Noruega 3
India 3
Finlandia 3
Polonia 3
Taiwán 2
República Checa 2
Luxemburgo 2
Emiratos Árabes Unidos 2
Austria 2
Eslovenia 2
España 1

Por último, decir que entre los expertos actuales que intervienen en la compilación de esta lista Top500 tenemos a Jack Dongarra de la Universidad de Tennessee, Erich Strohmaier y Horst Simon del NERSC (National Energy Research Scientific Computing Center) y del Lawrence Berkeley National Laboratory (LBNL), y hasta 2014 también participaba Hans Meuer de la Universidad de Mannheim en Alemania.

También te invito a leer nuestra guía con los mejores procesadores del mercado.

Algunos se preguntan si esta lista es fidedigna, y realmente lista los 500 equipos más potentes del mundo. Y lo cierto es que no se puede asegurar con certeza. Se podría decir que tiene a los 500 supercomputadores más potentes conocidos, puesto que si algún país tiene algún supercomputador secreto, no aparecería en la lista. Es más, se sabe que existen algunas máquinas grandes que no se encuentran en esta lista Top500, como es el caso de Blue Waters de la NSCA, OceanLight, RIKEN MDGRAPE, etc., que no han querido participar en la lista…

Un poco de historia

Debido al rápido crecimiento de la supercomputación, se hizo necesario llevar un seguimiento de las capacidades de este sector con fines informativos. Además, a principios de los años 90 se necesitaba una nueva definición de qué era una supercomputadora. Y después de usar varias métricas que no resultaron ser apropiadas hasta 1992, en la Universidad de Mannheim surgió la idea de usar el recuento de procesadores instalados.

A principios de 1993 convencieron a Jack Dongarra para que se uniera al proyecto de los puntos de referencia de LINPACK y entonces se produjo la primera prueba para confeccionar la lista. Consultando diversas fuentes, se publicaron dos primeras listas y surgiendo así el sitio Top500 tal como lo conocemos actualmente.

Desde esta fecha, el número 1 del ranking del Top500 siempre ha estado ocupado por un sistema que seguía la famosa ley de Moore, duplicando la cantidad de transistores cada 14 meses aproximadamente. Y, aunque la mayoría de estas supercomputadoras estaban basadas en procesadores x86 como los Intel Xeon y AMD Opteron/EPYC, así como los IBM POWER, lo cierto es que últimamente también hemos visto sorpresas con otras CPUs más exóticas, como es el caso de la Fugaku japonesa, con chips Fujitsu A64FX basados en ARM.

Además, últimamente se han agregado los sistemas basados en computación heterogénea, por lo que también se usa la potencia de cómputo de otras unidades usadas como aceleradores, como pueden ser las GPUs.

Datos interesantes de la Top500

Para apreciar mejor la evolución que han tenido los microprocesadores usados en HPC a lo largo de los años en esta lista Top500, se puede ver este gráfico:

Top500

Como se puede apreciar, en las actuales supercomputadoras de la lista Top500, Intel es el líder indiscutible, seguido de AMD y los IBM POWER. Poco a poco estos han ido estrangulando al resto de diversidad de procesadores que hubo en el pasado, donde todo estaba más repartido. No obstante, poco a poco también vemos que aparecen chips Fujitsu A64FX, Cavium y ThunderX basados en ARM, entre otras arquitecturas.

Por otro lado, también se puede hacer el mismo análisis con los sistemas operativos, y en este caso hay un claro dominante: Linux. Y es que el sistema operativo de código abierto está actualmente potenciando al 100% de las supercomputadoras de la lista Top500:

Top500 Linux

Poco a poco otros Unix han ido dejando paso a Linux, que ha acabado con todos. Dentro de los Unix ha habido diversos sistemas operativos, como los HP-UX, IBM AIX, Solaris, etc. Y dentro de Linux también existen diversas distribuciones como:

Sistema operativo Sistemas
Linux (otros, como SUSE Linux Enterprise Server o SLES, Ubuntu Server,…) 264
CentOS 89
Cray Linux Environment (ahora propiedad de HPE) 31
bullx SCS 12
Red Hat Enterprise Linux (RHEL) 12

Otros datos curiosos es saber que los aceleradores más empleados en estos supercomputadores de la lista Top500 son:

Acelerador Sistemas
NVIDIA TESLA V100 (lanzado: 2017) 80
NVIDIA AMPERE A100 (lanzado: 2020) 15
NVIDIA TESLA V100 SXM2 (lanzado: 2017) 12
NVIDIA TESLA P100 (lanzado: 2016) 8
NVIDIA AMPERE A100 SXM4 40 GB (lanzado: 2020) 5

Como se puede apreciar, NVIDIA es el líder absoluto en este tipo de sistemas para HPC.

Por otro lado, si nos centramos en los constructores o proveedores de supercomputadoras, nos encontramos que los líderes son:

Fabricante Sistemas
Lenovo (China) 184
Inspur (China) 58
Sugon (China) 45
HPE o Hewlett Packard Enterprise (EE.UU.) 39
Atos (Europa) 36

Como vemos, el fabricante Lenovo es uno de los principales. No obstante, aunque no se incluyan en esta tabla, también existen otros como IBM, Dell EMC, Fujitsu, NEC, MEGWARE, etc.

Ejemplo Top10 actual

Por ejemplo, para que te hagas una idea, aquí tienes una tabla con el Top10 de la Top500 actual:

Puesto Rmax
Rpeak
(PetaFLOPS)
Nombre Modelo recuento de Núcleos de CPU recuento de Núcleos del acelerador Interconexión de red
Fabricante País y sitio Año sistema operativo
1

1.102,00
1.685,65

Frontier HPE Cray EX235a 591.872

(9.248 × EPYC 3ª Gen de
64 núcleos a 2,0 GHz)

36.992 × 220 AMD Instinct MI250X Slingshot-11

HPE

Laboratorio Nacional de Oak Ridge –  Estados Unidos 2022 HPE Cray y SUSE
2

442.010
537.212

Fugaku Fugaku 7.630.848

(158.976 × Fujitsu A64FX
de 48 núcleos a 2,2 GHz)

No usa Interconexión de Tofu D

Fujitsu

Centro RIKEN de Ciencias Computacionales –  Japón 2020 RHEL
3

309,10
428,70

LUMI HPE Cray EX235a 150.528

(2352 × EPYC 3ª Gen
con 64 núcleos a 2,0 GHz)

9.408 × 220 AMD Instinct MI250X Slingshot-11

HPE

EuroHPC JU – Unión Europea, Kajaani, Finlandia 2022 HPE Cray y SUSE
4

174,70
255,75

Leonardo ToroSequana XH2000 110.592

(3456 × Xeon Platinum 8358
de 32 núcleos a 2,6 GHz)

13.824 × 108 Nvidia Ampere A100 Nvidia HDR100 Infiniband

Atos

EuroHPC JU – Unión Europea, Bolonia, Italia 2022 Linux
5

148.600
200.795

Summit IBM Power System
AC922
202.752

(9.216 × IBM POWER9
de 22 núcleos a 3,07 GHz)

27.648 × 80 Nvidia Tesla V100 InfiniBand EDR

IBM

Laboratorio Nacional de Oak Ridge – Estados Unidos 2018 RHEL
6

94.640
125.712

Sierra IBM Power SYstem
S922LC
190.080

(8.640 × IBM POWER9
de 22 núcleos a 3,1 GHz)

17.280 × 80 Nvidia Tesla V100 InfiniBand EDR

IBM

Laboratorio Nacional Lawrence Livermore – Estados Unidos 2018 RHEL
7

93.015
125.436

Sunway
TaihuLuz
MPP Sunway 10.649.600

(40.960 × 260 núcleos Sunway SW26010 a 1,45 GHz)

No usa Sunway

NRCPC

Centro Nacional de Supercomputación en Wuxi – China 2016 Raise OS
8

70,87
93,75

Perlmutter HPE Cray EX235n AMD EPYC 7763 de 64 núcleos a 2,45 GHz Nvidia Ampere A100 Slingshot-10

HPE

NERSC – Estados Unidos 2021 HPE Cray
9

63.460
79.215

Selene NVIDIA 71.680

(1120 × AMD EPYC 7742 de 64 núcleos a 2,25 GHz)

4480 × 108 Nvidia Ampere A100 Mellanox HDR Infiniband

NVIDIA

Nvidia – Estados Unidos 2020 Ubuntu
10

61.445
100.679

Tianhe-2A TH-IVB-FEP 427.008

(35.584 × Intel Xeon E5–2692 v2 de
12 núcleos a 2,2 GHz)

35.584 × Matrix-2000 128 núcleos TH expreso-2

NUDT

Centro Nacional de Supercomputadoras en Guangzhou – China 2018 Kylin

Si te fijas en la tabla anterior, tenemos varias columnas que te explico a continuación:

  • Posición: es la posición que ocupa actualmente dentro del ranking Top500 de la lista según la revisión de noviembre de 2022.
  • Rmax/Rpeak: se refieren a la puntuación en LINPACK, es decir, el rendimiento en medido en PFLOPS o PetaFLOPS.  Mientras Rmax es el rendimiento que ha alcanzado en LINPACK, Rpeak es el rendimiento máximo teórico que tendrían este sistema.
  • Nombre: es el nombre del supercomputador.
  • Modelo: se refiere a la plataforma empleada para su creación o quién lo comercializa.
  • Recuento de núcleos de CPU/Recuento de núcleos del acelerador: la cantidad de núcleos de procesamiento de CPU o de otro acelerador que emplea.
  • Interconexión de red:  se refiere al tipo de red que interconecta los nodos instalados. Suelen ser redes de alto rendimiento como InfiniBand, Gigabit Ethernet u otras propietarias. De esta forma, todos esos nodos pueden trabajar como un solo computador.
  • Fabricante: es la empresa encargada de su diseño y montaje.
  • Sitio y País: el lugar donde está instalado el supercomputador.
  • Año: es el año de su instalación.
  • Sistema operativo: el SO o SSOO que emplea para funcionar.

¿Qué es Green500?

Fugaku Top500

Como bien sabes, estas enormes máquinas consumen gran cantidad de energía. Estos centros de procesamiento de datos podrían llegar a varias decenas de megavatios hora, lo que supone un consumo muy elevado y un gasto energético igualmente caro. Y a todo esto hay que agregar la energía necesaria para los sistemas de refrigeración, que también suele estar por varios megavatios.

Por eso, de forma semestral, los miembros de la lista Top500 también muestran un listado con los 500 supercomputadores ordenados según su rendimiento/vatio consumido, es decir, por su nivel de eficiencia. Esto te da una idea de cuáles son los sistemas más eficientes.

La lista Green500 ha estado encabezada por diferentes tipos de equipos, algunos basados en x86, otros en POWER, con o sin aceleradores, etc. Sin embargo, en este caso el ranking sería algo similar a este ejemplo de los 3 supercomputadores más eficientes según la lista Green500 de 2022:

Puesto Rendimiento
por vatio
(GFLOPS/vatio)
Nombre Modelo
Procesadores, GPU, Interconexión
Proveedor Sitio,
País, año
Rmax
(PFLOPS)
1 65.091 Henri Lenovo ThinkSystem SR670 V2
Intel Xeon Platinum 8362 2,8 GHz (32C), Nvidia H100 80 GB PCIe, InfiniBand HDR,
Lenovo Instituto Flatiron
– Estados Unidos, 2022
2.04
2 62.684 Frontier TDS
HPE Cray EX235a
AMD Optimized EPYC 64C de 3.ª generación 2 GHz, AMD Instinct MI250X, Slingshot-11
HPE OE/SC/Laboratorio Nacional de Oak Ridge – Estados Unidos, 2022 19.20
3 58.021 AdAstra HPE Cray EX235a
AMD Optimized EPYC 64C de 3.ª generación 2 GHz, AMD Instinct MI250X, Slingshot-11
HPE Grand Equipement National de Calcul Intensif – Centre Informatique National de l’Enseignement Superieur (GENCI-CINES),
 – Francia, 2022
46.10

En este otro caso tenemos una columna para la posición ocupada en la Green500, una segunda que muestra la eficiencia contabilizada en GFLOPS/w, luego hay otra columna con el nombre del supercomputador, otra más con las características técnicas, el fabricante, el lugar donde está instalado y fecha, y el rendimiento según Rmax en PFLOPS, para hacerte una idea de dónde estaría posicionado en la lista Top500.

Como se puede comprobar, el número 1 actual del Green500 puede desarrollar un rendimiento por vatio de 65.091 GFLOPS. En cambio, si lo buscamos en la lista Top500, el Henri estará en el puesto número 11 de los más potentes del mundo.

Quizás estés pensando ¿y los ARM? Pues bien, parece que esto es el mundo al revés, ya que mientras Arm siempre ha presumido de rendimiento y eficiencia, y pese a que muchos veían disparatado que un Arm pudiera superar a otros procesadores, lo cierto es que han demostrado que los que creían eso estaban equivocados. El ejemplo está en el Fugaku, que se basa en chips ARM de Fujitsu y ahora se sitúa en la posición 2 del Top500, aunque no hace mucho llegó a ocupar la posición 1. Sin embargo, cuando analizamos la lista Green500, pensarías que está de los primeros…

En realidad del Fugaku está en la posición 43, con 15.418 GFLOPS/w. ¿Entonces? ¿Te han engañado? ¿Los ARM no son tan eficientes? Bueno, si lo comparamos con el Frontier que ocupa la posición 1 del Top500 en la actualidad, vemos que ocupa una posición mucho mejor en el ranking Green500, con un sexto puesto. Y eso que está basado en AMD EPYC y aceleradores AMD Instinct MI250X. Y no solo eso, tiene más núcleos, con un total de 8.730.112 frente a los 7.630.848 del Fugaku.

Como se puede apreciar en esta comparativa, no siempre ARM es el más eficiente. Aquí tienes la prueba. Además, que gracias a los aceleradores se pueden conseguir grandes ventajas de rendimiento por vatio consumido como ya expliqué aquí. Y, como se puede comprobar en la lista Top500, el Fugaku usa solo la potencia de sus procesadores Fujitsu A64FX, y carece de aceleradores…

En definitiva, la ISA no siempre es lo más importante cuando se trata de rendimiento y consumo, sino la microarquitectura, es decir, la forma en la que se implementa esa ISA. Y, como nos ha dado una lección esta lista Green500, la computación heterogénea es una gran ventaja.

¿Qué es Graph500?

centro de datos

Para finalizar, existe otra lista o clasificación de sistemas HPC, pero en este caso no está orientada al rendimiento de cálculo como la Top500 ni a la eficiencia energética como Green500, sino que etá orientada a posicionar las supercomputadoras según las cargas de datos intensivas. T esta lista se denomina Graph500.

Para el que no lo sepa, la computación intensiva de datos se refiere a un tipo de aplicaciones paralelas que se usan para procesar grandes volúmenes de datos, generalmente del orden de Terabytes o Petabytes en cuestión se segundos, como ocurre en el Big Data. Este tipo de aplicaciones tienen una demanda de cómputo intensiva, y también de E/S.

La Graph500 se publicó por primera ve en 2010 en la ACM/IEEE Supercomputing Conference. Esta lista también se basa en una actualización de dos veces por año, como la Top500, en junio y en noviembre, coincidiendo con la otra.

En cambio, en vez de usar en este caso el benchmark LINPACK, en este Graph500 se emplean métricas de rendimiento basadas en GTEPS (GigaTEPS), siendo TEPS las siglas de Traversed Edges Per Second. Se trata de una medida de capacidad de comunicación, y contrasta con los FLOPS (Floating Point Per Second) que son de puro rendimiento de cálculo en coma flotante de precisión doble (64-bit), o FP64, y no tiene en cuenta las capacidades de comunicación de la máquina.

Evidentemente, no siempre se necesita en un centro de procesamiento que destaquen los GTEPS si no se va a usar la supercomputadora para fines como el Big Data, ya que, por ejemplo, las simulaciones de CFD o las aplicaciones científicas suelen necesitar rendimiento de FLOPS.

Gracias a Graph500, se pueden catalogar las supercomputadoras más potentes del mundo según estos términos y así poder analizar los problemas relacionados con los datos complejos. Y es que estos sistemas necesitan un énfasis en los sistemas de comunicación.Para medir este rendimiento en GTEPS se usan varios programas como benchmarks, como puede ser GNU Octave, versiones de programas en C haciendo uso de OpenMP, MPI, etc.

Para hacerte una idea de esta lista, te muestro la siguiente tabla actualizada en noviembre de 2022, con los 3 primeros en la Graph500:

Posición País Sitio Máquina (Arquitectura) Número de nodos Numero de núcleos Escala de problema GTEPS
1 Japón RIKEN Advanced Institute for Computing Science Supercomputadora Fugaku ( Fujitsu A64FX ) 158976 7630848 41 102955
2 China Pengcheng Lab Pengcheng Cloudbrain-II (Kunpeng 920+Ascend 910) 488 93696 40 25242.9
3 China National Supercomputing Center Wuxi Sunway TaihuLight (Sunway MPP) 40768 10599680 40 23755.7

Como ves, en este caso las columnas son diferentes a las de Top500 y Green500. En este caso tenemos las habituales de la posición, país y sitio, el tipo de máquina del que se trata, número de nodos y de núcleos, y por último tenemos dos columnas especiales, con la escala del problema y la puntuación en GTEPS conseguida. Como vemos, el Fugaku vuelve a estar en puestos destacados, en este caso como líder.

Debes saber que existen otros puntos de referencia para HPC, como el HPCG (High Performance Conjugate Gradient), aunque este benchmark propuesto por Michael Heroux de Sandia National Laboratories, junto con Piotr Luszczek y Jack Dongarra de la Universidad de Tennessee no han tenido tanta relevancia. En este caso, para probar el efecto de las limitaciones del subsistema de memoria y la interconexiones internas. Pero esto ya es otra historia…

Ahora es tu turno, no olvides comentar…

Isaac

Geek de los sistemas electrónicos, especialmente del hardware informático. Con alma de escritor y pasión por compartir todo el conocimiento sobre tecnología.
Los datos de carácter personal que nos facilite mediante este formulario quedarán registrados en un fichero de Miguel Ángel Navas Carrera, con la finalidad de gestionar los comentarios que realizas en este blog. La legitimación se realiza a través del consentimiento del interesado. Si no se acepta no podrás comentar en este blog. Puedes consultar Política de privacidad. Puede ejercitar los derechos de acceso, rectificación, cancelación y oposición en [email protected]
Botón volver arriba