Los chiplets son tanto la solución como el síntoma de un problema mayor

una-oblea-de-silicio-en-arena-tal vez

Cuando AMD anunció sus CPU Ryzen de tercera generación, también declaró que usaría un nuevo método para conectar sus CPU. En lugar de construir CPU monolíticas estándar (o conectar dos CPU monolíticas juntas en lo que se conoce como Módulo Multi-Chip, o MCM), AMD optó por un nuevo tipo de configuración llamado chiplet. Desde una perspectiva de marketing, los chiplets han sido un gran éxito; He visto a muchos lectores muy entusiasmados con lo que aportan. Pero existe un contexto más amplio en torno a los chiplets, y por qué estamos dando este paso en la fabricación de semiconductores, que merece ser explorado, especialmente si desea comprender los problemas más importantes que impulsan a toda la industria, en lugar de solo a AMD.

Los chiplets son un síntoma de un problema mayor que está teniendo la industria de los semiconductores y (con suerte) al menos una solución a corto plazo para ese mismo problema. Como sabemos más sobre la estrategia de AMD, me referiré a ella a lo largo de este artículo, pero AMD no es la única empresa que adopta chiplets. Todos los desarrolladores de silicio de alto rendimiento parecen estar al menos evaluando esta idea.



¿Qué es un Chiplet?

Porque tan pronto como este término se ha popularizado, no siempre se define. Un chiplet contiene algunos de los bloques de funciones especializados que normalmente consideramos que componen un microprocesador monolítico. Con sus CPU Ryzen de tercera generación, AMD ha optado por dividir sus controladores de E / S y DRAM en un solo bloque funcional, mientras que sus núcleos de CPU y caché L3 están contenidos dentro de cada chiplet individual.





AMD-Epyc-Chiplet

La matriz de E / S de Epyc, como se muestra en el evento New Horizon de AMD.

Esta no es la única forma intrínseca de construir un chiplet. Con el tiempo, esperamos ver a los fabricantes experimentar con otras metodologías de diseño en función de las necesidades de sus proyectos específicos. Algunos chips pueden beneficiarse de las agrupaciones centrales de caché. En otros casos, las empresas pueden optar por implementar chiplets asimétricos con diferentes capacidades en cada uno en lugar de duplicar el mismo tipo de chip como lo hace AMD para construir sus CPU Epyc. Había teorías de que AMD podría implementar una APU Ryzen de tercera generación con una CPU para un chiplet y una GPU para el otro, pero AMD ha declarado que no usará su arquitectura Matisse para este propósito. Cuando finalmente veamos una APU basada en chiplet, es posible que AMD continúe construyendo la CPU y la GPU en el mismo dado, pero mantendrá la E / S y la DRAM en un IC separado, o podría tener una subdivisión completamente diferente. en mente.



Uno de los principales objetivos de diseño de los chiplets es ofrecer a los fabricantes más opciones a la hora de decidir qué componentes de un diseño encoger frente a cuáles mantener en el mismo tamaño y nodo de proceso.



Los límites para encoger

“Más rápido, más pequeño, más barato” ha sido el lema de la industria de las computadoras durante al menos los últimos 60 años. La premisa fundamental de la ley de Moore, tal como la formuló originalmente Gordon Moore, era que los avances en la fabricación tecnológica conducirían a avances en la integración. Fue la capacidad de construir componentes uno al lado del otro lo que permitió la creación de las primeras CPU y, más tarde, lo que permitió que esas CPU absorbieran funcionalidad y capacidad adicionales.

Pero aunque muchos componentes diferentes tuvieron que escalar hacia abajo durante décadas para que este proceso ocurriera de la forma en que lo hizo, la cantidad total de escalado disponible ha sido diferente. Como explicación simplificada: hay un punto en el que ya no tiene sentido hacer las almohadillas de contacto más pequeñas o intentar construir cables más delgados porque el aumento de la resistencia eléctrica supera cualquier beneficio en la reducción de potencia. Esta escala irregular no es nueva. Los circuitos analógicos tampoco escalan con los nuevos nodos de proceso, y la dificultad de interconectar lo analógico y lo digital en el mismo SoC se ha vuelto más difícil a medida que llegamos a los nodos inferiores. Lo nuevo, el problema que requirió la adopción de nuevas estrategias de fabricación, es que ahora nos enfrentamos a muchos problemas de escala, tiene sentido romper con 60 años de precedentes y comenzar a dividir la CPU nuevamente.



El hecho de que ya no podamos escalar todos los aspectos de la CPU a un nuevo nodo y esperar beneficiarnos es un cambio fundamental con respecto al pasado cuando esta suposición era la predeterminada. Es probable que las futuras mejoras en E / S o cualquier otro componente “dejado atrás” en un nodo antiguo se deban entregar mediante mejores algoritmos, mejoras de empaque o ingeniería de materiales, no reducciones de nodos de proceso.

En teoría, esto podría resultar en mejoras más pequeñas por nodo. Si solía poder mejorar el diseño de un chip completo en un 15 por ciento (para cualquier métrica de mejora a la que esté apuntando) y ahora tiene que limitar sus mejoras aplicadas al 50 por ciento de la CPU que está apuntando para una reducción del dado, puede ver ganancias absolutas más pequeñas en general.



La razón por la que las empresas están dispuestas a tolerar esto es porque el costo por milímetro de las nuevas CPU se está disparando, al igual que los costos de diseño. La siguiente diapositiva fue mostrada por Lisa Su en IEDM 2017.



Precio AMD Wafer

AMD predice que su costo por cedido milímetro se duplicará de 14 / 16nm a 7nm. El impacto de los altos rendimientos, en otras palabras, ya se ha tenido en cuenta en este gráfico.

¿Qué pueden resolver los Chiplets?

Los chiplets pueden abordar varias tendencias negativas en la fabricación de semiconductores, al menos hasta cierto punto. Presentan a los fabricantes un medio potencialmente más eficiente de lograr encogimientos de matrices, al centrar la investigación y el desarrollo en aquellas partes del chip que pueden encogerse de manera rentable. Con un diseño monolítico, los fabricantes de chips tienen que encoger todo el chip, incluso si ciertos bloques no se actualizan y no funcionan de manera diferente a partir de entonces.

En segundo lugar, la construcción de chips más pequeños permite menos desperdicio de obleas (las CPU más pequeñas desperdician menos espacio en el borde), una mayor cantidad de núcleos de CPU por oblea y mejora el rendimiento. En un diseño monolítico, un núcleo de CPU defectuoso de cada 18 significa, en el mejor de los casos, que no se puede vender la CPU como un chip completo de 18 núcleos. Tendrá que agruparse en un segmento de menor precio. Con los chiplets, teóricamente estás renunciando a menos cuando lanzas un chiplet en lugar de bajar el precio o lanzar un núcleo monolítico. El ahorro exacto depende de las características específicas de sus tasas de rendimiento y las opciones para vender chips menos que perfectos, pero la posibilidad ciertamente está ahí.

En tercer lugar, los chiplets teóricamente permiten a los fabricantes especializar bloques de funciones individuales para materiales y procesos específicos. Achronix señala este punto en un PDF reciente centrado en chiplet, escritura :

El material semiconductor utilizado para fabricar cada chiplet no se limita al silicio, que es otra ventaja del chiplet. Por ejemplo, se pueden fabricar chiplets especializados a partir de una variedad de materiales semiconductores compuestos, incluidos SiGe (silicio germanio), GaAs (arseniuro de galio), GaN (nitruro de galio) o InP (fosfuro de indio) para aprovechar las propiedades electrónicas únicas de estos materiales semiconductores. .

Pero de nuevo, esto sería una profunda desviación del diseño de CPU tradicional. GaN, InP, GaAs y SiGe existen al margen del silicio convencional, utilizado para fines especializados donde sus características particulares les dan una ventaja sobre la fabricación tradicional. Es por eso que, a pesar de las ventajas específicas de estos materiales para ciertos tipos de chips, no los vemos usados ​​en, digamos, su Core i7 o AMD Ryzen típico.

Los beneficios de los chiplets no se pueden separar de las dificultades para impulsar su uso

Si bien AMD ha estado más estrechamente asociado con los chiplets en los últimos meses, están lejos de ser la única empresa que trabaja en la tecnología. EMIB de Intel y Foveros Ambas tecnologías tienen aplicaciones potenciales de chiplet. Esta es un área en la que están avanzando varias empresas porque se espera que sea un camino a seguir que pueda funcionar para muchos tipos de diseños.

Ya sabemos que el Ryzen de tercera generación de AMD ofrecerá mejoras significativas en el consumo de energía y el rendimiento general. Claramente, las ventajas de separar las CPU para continuar moviéndose a nodos de proceso más pequeños superan la ventaja de mantener diseños monolíticos, al menos para AMD. Es probable que otras empresas sigan su ejemplo.

Pero la adopción de chiplets es también el reconocimiento de la ingeniería de las limitaciones que antes no existían. No solíamos necesitar chiplets. Cuando empresas como TSMC predecir públicamente que su nodo de 5 nm ofrecerá mejoras de potencia y rendimiento mucho menores que las de los nodos anteriores, es en parte una admisión tácita de que las mejoras que los ingenieros se han acostumbrado a realizar desde los nodos de proceso ahora tendrán que obtenerse de una manera diferente. Nadie está particularmente seguro de cómo hacer esto, y los análisis de la eficacia con la que los ingenieros mejoran el rendimiento sin transistores adicionales para resolver el problema han no he sido optimista . Las iniciativas para examinar el impacto en el rendimiento del procesamiento a escala de obleas son otro ejemplo de cómo los ingenieros están buscando nuevas formas de chips de construcción u optimizarlos después de la fabricación, para ofrecer las mejoras de rendimiento que una vez obtuvimos de las reducciones de nodos.

Vamos a hablar mucho sobre chiplets una vez que llegue Ryzen de tercera generación y tengamos la oportunidad de profundizar en cómo AMD ha adoptado esta tecnología y cuáles son los beneficios. Sin duda, los chips posteriores nos brindarán una visión más amplia de las ventajas y desventajas. Pero en cuanto a cómo pensar sobre chiplets: yo los llamaría una adaptación inteligente a un problema fundamental. No están hechos de polvo de hadas o cuernos de unicornio. No vuelven a habilitar mágicamente el tipo de escalado de CPU que solíamos ver hace años. No ofrecen un mejor rendimiento de forma automática o intrínseca (es posible que lo hagan, pero no es un hecho) y las ventajas que hacer La transmisión en términos de rendimiento y costo debe verse como una respuesta al aumento vertiginoso de los precios de los nodos y las dificultades generales de rendimiento que tardan más en resolverse que antes.

Es importante tener en cuenta el estado del ecosistema más grande al evaluar qué esperar en cuanto a las mejoras derivadas del chiplet. La industria inventó colectivamente los chiplets porque los necesitaba para continuar ofreciendo mejoras de una generación a la siguiente, incluso si eso significaba tirar por la ventana décadas de ortodoxia del diseño. Son tanto una demostración alentadora de que hemos continuado encontrando soluciones a los problemas de escala como un recordatorio de que las leyes de la física se están endureciendo a nuestro alrededor, creando el requisito de tales soluciones en primer lugar.