El equipo aborda el desafío térmico que enfrentan los centros de datos

Dos años después de hablar en una conferencia sobre su ambiciosa visión para enfriar los centros de datos del mañana, Ali Heydari y su equipo recibieron una subvención de $5 millones para construirlos.

Fue el más grande de los premios del 15 de mayo del Departamento de Energía de EE. UU. Programa DoE llamado REFRIGERADORESrecibió más de 100 presentaciones de arquitectos informáticos e investigadores.

“Este es otro ejemplo de cómo estamos rediseñando el centro de datos”, dijo Ali Heydari, un distinguido ingeniero de NVIDIA que lidera el proyecto y ha ayudado a implementar más de un millón de servidores en roles anteriores en Baidu, Twitter y Facebook. .

“Celebramos en Slack porque el equipo está en todo Estados Unidos”, dijo Jeremy Rodríguez, quien una vez construyó sistemas de refrigeración líquida hiperdimensionales y ahora dirige un equipo de ingenieros para los centros de datos de NVIDIA.

Un cambio histórico

El proyecto es ambicioso y llega en un momento crítico de la historia de la informática.

Se espera que los procesadores generen órdenes de magnitud más calor a medida que la Ley de Moore alcance los límites de la física, pero las demandas de los centros de datos continúan creciendo.

Pronto, los sistemas enfriados por aire de hoy en día ya no podrán mantenerse al día. Las técnicas actuales de refrigeración líquida no podrán manejar más de los 40 vatios por centímetro cuadrado que los investigadores esperan que el futuro silicio en los centros de datos necesite disipar.

Así, el grupo de Heydari definió un avanzado sistema de refrigeración líquida.

Su enfoque promete enfriar un centro de datos empaquetado en un contenedor móvil, incluso cuando se coloca en un entorno de hasta 40 grados centígrados y consume 200 kW, 25 veces más energía que los racks de servidores actuales.

Costará al menos un 5 % menos y funcionará un 20 % más eficientemente que los enfoques enfriados por aire actuales. Es mucho más silencioso y también tiene una menor huella de carbono.

“Este es un gran logro para nuestros ingenieros, que son personas muy inteligentes”, dijo, y señaló que parte de su misión es concienciar a la gente sobre los cambios que se avecinan.

Una propuesta radical

La solución del equipo combina dos tecnologías que nunca antes se habían utilizado en tándem.

Primero, los chips se enfriarán con placas frías, cuyo refrigerante se evapora como el sudor en las frentes de los procesadores que trabajan duro, y luego se enfriarán para condensarse y volver a formarse en líquido. En segundo lugar, los servidores completos con componentes de menor potencia estarán encerrados en contenedores sellados herméticamente y sumergidos en refrigerante.

Diagrama de diseño de refrigeración líquida de NVIDIA para centros de datos
Nueva solución: los servidores se bañarán en fluidos refrigerantes como parte del proyecto.

Usarán un líquido que es común en los refrigeradores y acondicionadores de aire de los automóviles, pero que aún no se usa en los centros de datos.

Tres escaleras gigantes

El proyecto de tres años establece hitos anuales: pruebas de componentes el año siguiente, una prueba de bastidor parcial un año después y, finalmente, todo el sistema probado y entregado.

Si es así, el equipo creará un gemelo digital completo del sistema utilizando Omniverso de NVIDIAuna plataforma de desarrollo abierta para construir y ejecutar metaverso aplicaciones

El equipo de NVIDIA está formado por una docena de ingenieros térmicos, energéticos, mecánicos y de sistemas, algunos dedicados a crear un gemelo digital. Están asistidos por siete socios:

  • Universidades de Binghamton y Villanova en análisis, pruebas y simulación
  • BOYD Corp. para platos fríos
  • Grupo Durbin para el sistema de bombeo
  • Honeywell para obtener ayuda con la selección de refrigerante
  • Laboratorio Nacional Sandia en Evaluación de Confiabilidad y
  • Corporación Vertiv. al rechazar el calor

“Estamos ampliando las relaciones que hemos construido a lo largo de los años, y cada grupo trae una variedad de ingenieros”, dijo Heydari.

Por supuesto, esto también es un trabajo duro.

Por ejemplo, Mohammed Tradat, ex investigador de Binghamton que ahora dirige el grupo de ingeniería de hardware del centro de datos de NVIDIA, “pasó una noche sin dormir trabajando en la solicitud de subvención, pero es un trabajo de amor para todos nosotros”, dijo.

Heydari dijo que nunca imaginó que el equipo se daría cuenta de sus ideas cuando habló sobre ellas a fines de 2021.

“Ninguna otra compañía nos hubiera permitido construir una organización que pudiera hacer este tipo de trabajo; estamos haciendo historia y es increíble”, dijo Rodríguez.

Mire el video a continuación para ver cómo los gemelos digitales integrados en Omniverse ayudan a optimizar el diseño del centro de datos.

(incrustar)https://www.youtube.com/watch?v=gGg2wpzukPA(/incrustar)

Imagen superior: Reunidos recientemente en la sede de NVIDIA están (desde la izquierda) Scott Wallace (NVIDIA), Greg Strover (Vertiv), Vivien Lecoustre (DoE), Vladimir Troy (NVIDIA), Peter Debock (director del programa COOLERCHIPS), Rakesh Radhakrishnan (DoE) . ), Joseph Marsala (Durbin Group), Nigel Gore (Vertiv) y Jeremy Rodriguez, Bahareh Eslami, Manthos Economou, Harold Miyamura y Ali Heydari (todos NVIDIA).