Nvidia Tesla y AMD Epyc impulsarán la nueva supercomputadora Berkeley

Los triunfos de la supercomputación son un gran problema para los fabricantes de semiconductores. Ganar espacio en los sistemas superiores se considera una señal de estabilidad y longevidad. Implica que los proveedores en la cima del mercado y con acceso a importantes contratos gubernamentales a largo plazo creen que su hardware es lo suficientemente robusto y capaz como para ser utilizado en investigaciones científicas de vanguardia en una de las instalaciones más grandes de los Estados Unidos. La economía de estos acuerdos es decididamente más turbia, pero como cuestión de relaciones públicas, las empresas tienden a adorarlos. Tanto Nvidia como AMD tienen algo de qué alardear hoy, dado un nuevo anuncio de Cray y Berkeley National Labs.

El Centro Nacional de Computación Científica de Investigación Energética utilizará un Instalación de Cray Shasta para su supercomputadora de próxima generación, con nombre en código 'Perlmutter'. Para ser claros, 'Shasta' es lo que Cray llama la arquitectura de supercomputadora, mientras que Perlmutter es el nombre del sistema NERSC específico que se construirá. Shasta está diseñado para ser compatible con arquitecturas ARM y x86 de Intel y AMD con soporte para una variedad de estándares de interconexión, incluidos Slingshot de Cray, Omnipath de Intel y Mellanox (Infiniband). Para aquellos de ustedes que asocian Infiniband con Intel, la compañía compró su propia tecnología Infiniband en 2012, pero Omnipath es una tecnología diferente, específica de Intel, con la que compite Infiniband de Mellanox. Shasta está diseñado para integrar componentes y aceleradores de una variedad de empresas, incluidas GPU, FPGA y aceleradores específicos de IA.



La nueva interconexión Slingshot de Cray es una parte fundamental del sistema (y escalar la potencia de interconexión hacia abajo es importante para que finalmente alcancemos la capacidad de cálculo a exaescala). A continuación, se incluye un breve video sobre la nueva interconexión:





Todavía no tenemos cifras sobre qué CPU Epyc o cuántos núcleos implementará NERSC, o cuántas GPU contendrá. Nvidia, sin embargo, también se jacta de su propia inclusión en el proyecto, con un estudio que afirma que el 50 por ciento de las cargas de trabajo que realizará Perlmutter son capaces de ejecutarse en GPU. Esta será la primera supercomputadora NERSC enfocada en computación heterogénea, por lo que obtener la victoria es una buena pluma in Nvidia s hacia y sin duda representa un gran esfuerzo a largo plazo para garantizar que las cargas de trabajo funcionen bien. Tampoco sabemos qué productos Tesla utilizará NERSC, pero esperaríamos que fuera hardware cerca de la parte superior de la pila Tesla de Nvidia.



NERSC-gpu-readiness

Núcleos de GPU NERSC



NERSC trabaja en varios campos críticos, incluida la investigación de fusión nuclear, el modelado climático, la investigación en ciencia de los materiales y la investigación en biología centrada en la estructura molecular y su relación con el descubrimiento de fármacos y el desarrollo de vacunas. Si bien esta máquina no es en sí misma una implementación de clase exaescala, se espera que utilice algunas de las mismas tecnologías y estándares que implementaremos para la computación exaescala cuando los primeros sistemas entren en línea (teóricamente) en 2021.