¿Eliminar las placas base podría mejorar el rendimiento de la PC?

Asus-Strix-Z270E-PCIe-3

Uno de los temas a los que hemos vuelto repetidamente en importpartsspecialists.com es la dificultad de escalar el rendimiento tanto en CPU como en GPU. Los fabricantes de semiconductores de todo el mundo están lidiando con este problema, al igual que los diseñadores de CPU y GPU. Hasta la fecha, no ha habido curas milagrosas ni soluciones fáciles para el problema, pero las empresas han recurrido a una amplia gama de enfoques alternativos para ayudarles a impulsar el rendimiento básico de los semiconductores, incluidos nuevos tipos de tecnología de envasado. HBM, chiplets e incluso tecnologías como la nueva interconexión 3D de Intel, Foveros, son parte de un amplio esfuerzo de la industria para encontrar nuevas formas de conectar chips en lugar de centrarse únicamente en hacer chips más pequeños.



Ahora, un par de investigadores argumentan que es hora de dar un paso más y deshacerse de la placa de circuito impreso por completo. En un artículo para IEEE Spectrum, Puneet Gupta y Subramanian S. Iyer escriben que es hora de reemplazar los PCB con el propio silicio y fabricar sistemas completos en una sola oblea. Si ese argumento suena familiar, es porque la pareja son dos de los autores de un artículo que cubrimos a principios de este año sobre los méritos del procesamiento a escala de obleas para GPU utilizando una tecnología de interconexión que desarrollaron conocida como Si-IF - Silicon Interconnect Fabric.



El procesamiento a escala de obleas es la idea de usar una oblea de silicio completa para construir una pieza enorme: una GPU, en este caso. El trabajo del equipo de investigación mostró que este es un enfoque potencialmente viable hoy en día en términos de rendimiento, rendimiento y consumo de energía, con mejores resultados de los que se esperarían al construir el número equivalente de GPU independientes utilizando técnicas de fabricación convencionales. En el artículo, la pareja señala los muchos problemas asociados con el mantenimiento de las placas base en primer lugar, comenzando con la necesidad de montar el chip físico real en un paquete hasta 20 veces más grande que la CPU. Después de todo, la matriz de la CPU suele ser mucho más pequeña que el sustrato físico en el que está montada.



Diagrama: Brandon Palacio para Espectro IEEE

Los autores argumentan que el uso de paquetes físicos para chips (como hacemos cuando los montamos en una PCB) aumenta la distancia que las señales de chip a chip necesitan viajar en un factor de 10, creando una velocidad gigantesca y un cuello de botella de memoria. Esto es parte del problema con la llamada 'pared de memoria': los relojes y el rendimiento de la RAM han aumentado mucho más lentamente que el rendimiento de la CPU, en parte debido a la necesidad de conectar la memoria a cierta distancia física del paquete de la CPU. También es parte de por qué HBM puede proporcionar un ancho de banda de memoria tan enorme: acercar la memoria a la CPU permite rutas de señal mucho más amplias. Los chips empaquetados también son más difíciles de mantener frescos. ¿Por qué hacemos todo esto? Porque los PCB lo requieren.



Pero según los dos investigadores, los intercaladores de silicio y tecnologías similares son fundamentalmente los caminos equivocados. En su lugar, proponen unir procesadores, memoria, analógico, RF y todos los demás chiplets directamente en la oblea. En lugar de golpes de soldadura, los chips utilizarían pilares de cobre a escala micrométrica colocados directamente sobre el sustrato de silicio. Los puertos de E / S del chip se unirían directamente al sustrato con compresión térmica en una unión de cobre a cobre. Los disipadores de calor se pueden colocar a ambos lados del Si-IF para enfriar los productos más fácilmente, y el silicio es un mejor conductor del calor que el PCB.



Comparación de latencia

La gran dificultad de la escala actual tiene su propio argumento para explorar ideas como esta. El antiguo mantra de la ley de Moore / escala de Dennard de 'más pequeño, más rápido, más barato' ya no funciona. Es muy posible que la sustitución de las placas de circuito impreso por un mejor sustrato pueda permitir un escalado de rendimiento sustancialmente mejor, al menos en determinados escenarios. Los sistemas a escala de obleas serían demasiado costosos para instalarlos en el hogar de cualquier persona, pero podrían alimentar los servidores del futuro. Empresas como Microsoft, Amazon y Google están apostando miles de millones a la idea de que la próxima ola de computación de alto rendimiento estará impulsada por la nube, y las computadoras gigantes basadas en obleas podrían encontrar un hogar feliz en las bases de datos industriales. Según los resultados de las pruebas de GPU que cubrimos a principios de este año, parece que la idea tiene mérito. El gráfico anterior, del artículo de la GPU, muestra los requisitos de latencia, ancho de banda y energía para la integración a escala de obleas frente a los métodos convencionales.



El rendimiento no es la única razón por la que existe la PC

Sin embargo, también es importante reconocer que el ecosistema de PC no sólo existen para mejorar el rendimiento. Las PC están diseñadas para ser flexibles y modulares a fin de facilitar su uso en una amplia gama de circunstancias. Tengo una máquina antigua basada en X79 con un número limitado de puertos USB 3.0. Hace años, decidí complementar este escaso número con una tarjeta USB 3.0 de cuatro puertos. Si mi GPU necesita una actualización, la actualizo; no compro un sistema completamente nuevo. Si mi placa base falla, teóricamente puedo cambiar a una placa diferente. Una falla en la RAM significa tirar un dispositivo de DDR3 y colocar uno nuevo, no un reemplazo de pieza al por mayor. Esa flexibilidad de enfoque es parte de la razón por la cual las PC han disminuido en costo y por qué la plataforma se puede usar para tantas tareas diferentes en primer lugar.

Los autores hacen un trabajo encomiable al exponer tanto las fortalezas como las deficiencias de adoptar su solución Si-IF para la fabricación de semiconductores y el artículo, aunque es largo, vale la pena leerlo. Señalan que las empresas tendrían que diseñar sistemas redundantes a nivel de oblea para garantizar que cualquier falla en el lugar se mantuvieron al mínimo absoluto. Pero por el momento, toda la industria de los semiconductores está más o menos alineada en la dirección opuesta a una idea como esta. Todavía podría ser posible comprar un sistema con CPU AMD y GPU Nvidia, por ejemplo, pero eso dependería de una colaboración sin precedentes entre una fundición de clientes (TSMC, Samsung o GlobalFoundries) y dos clientes diferentes.



Sospecho que podríamos ver empresas que buscan este tipo de desarrollo a largo plazo, pero no es algo que esperaría que reemplazara al ecosistema de PC más convencional. Los beneficios de la capacidad de actualización y la flexibilidad son enormes, al igual que la economía de escala que estas capacidades crean colectivamente. Pero los grandes proveedores de centros de datos podrían optar por este enfoque a largo plazo si da resultados. La ley de Moore por sí sola no proporcionará las respuestas que buscan las empresas. Deshacerse de las placas base es una idea radical, pero si funciona y se puede hacer a un precio asequible, es probable que alguien lo intente.