Skip to main content

El conglomerado de redes sociales Meta es la última empresa de tecnología en construir una “supercomputadora de inteligencia artificial”, una computadora de alta velocidad diseñada específicamente para entrenar sistemas de aprendizaje automático. La compañía dice que su nuevo AI Research SuperCluster, o RSC, ya se encuentra entre las máquinas más rápidas de su tipo y, cuando se complete a mediados de 2022, será la más rápida del mundo.

“Meta ha desarrollado lo que creemos que es la supercomputadora de IA más rápida del mundo”, dijo el CEO de Meta, Mark Zuckerberg, en un comunicado. “Lo llamamos RSC para AI Research SuperCluster y estará completo a finales de este año”.

La noticia demuestra la centralidad absoluta de la investigación de IA para empresas como Meta. Rivales como microsoft y nvidia ya han anunciado sus propias “supercomputadoras de IA”, que son ligeramente diferentes de lo que consideramos supercomputadoras normales. RSC se utilizará para entrenar una variedad de sistemas en los negocios de Meta: desde algoritmos de moderación de contenido utilizados para detectar discursos de odio en Facebook e Instagram hasta funciones de realidad aumentada que algún día estarán disponibles en el futuro hardware AR de la compañía. Y sí, Meta dice que RSC se usará para diseñar experiencias para el metaverso: la marca insistente de la compañía para una serie interconectada de espacios virtuales, desde oficinas hasta arenas en línea.

“RSC ayudará a los investigadores de IA de Meta a construir nuevos y mejores modelos de IA que puedan aprender de billones de ejemplos; trabajar en cientos de idiomas diferentes; analice sin problemas texto, imágenes y video juntos; desarrollar nuevas herramientas de realidad aumentada; y mucho más”, escriben los ingenieros de Meta Kevin Lee y Shubho Sengupta en un entrada en el blog esbozando la noticia.

“Esperamos que RSC nos ayude a construir sistemas de IA completamente nuevos que puedan, por ejemplo, impulsar traducciones de voz en tiempo real para grandes grupos de personas, cada una hablando un idioma diferente, para que puedan colaborar sin problemas en un proyecto de investigación o jugar un juego AR juntos.”

La supercomputadora de inteligencia artificial de Meta se completará a mediados de 2022.
Imagen: Meta

El trabajo en RSC comenzó hace un año y medio, cuando los ingenieros de Meta diseñaron los diversos sistemas de la máquina (refrigeración, energía, redes y cableado) completamente desde cero. La fase uno de RSC ya está en funcionamiento y consta de 760 sistemas Nvidia GGX A100 que contienen 6080 GPU conectadas (un tipo de procesador que es particularmente bueno para abordar los problemas de aprendizaje automático). Meta dice que ya está proporcionando un rendimiento mejorado hasta 20 veces en sus tareas estándar de investigación de visión artificial.

Sin embargo, antes de finales de 2022, la fase dos de RSC estará completa. En ese momento, contendrá unas 16.000 GPU en total y podrá entrenar sistemas de IA “con más de un billón de parámetros en conjuntos de datos tan grandes como un exabyte”. (Este número bruto de GPU solo proporciona una métrica estrecha para el rendimiento general de un sistema, pero, en aras de la comparación, la supercomputadora de IA de Microsoft construida con el laboratorio de investigación OpenAI se construye a partir de 10,000 GPU).

Todos estos números son muy impresionantes, pero invitan a la pregunta: ¿qué es una supercomputadora de IA de todos modos? ¿Y cómo se compara con lo que solemos considerar como supercomputadoras: grandes máquinas desplegadas por universidades y gobiernos para procesar números en dominios complejos como el espacio, la física nuclear y el cambio climático?

Los dos tipos de sistemas, conocidos como computadoras de alto rendimiento o HPC, son ciertamente más similares que diferentes. Ambos están más cerca de los centros de datos que las computadoras individuales en tamaño y apariencia y dependen de una gran cantidad de procesadores interconectados para intercambiar datos a velocidades vertiginosas. Pero existen diferencias clave entre los dos, como explica el analista de HPC Bob Sorensen de Hyperion Research a el borde. “Los HPC basados ​​en IA viven en un mundo algo diferente al de sus contrapartes tradicionales de HPC”, dice Sorensen, y la gran distinción tiene que ver con la precisión.

La breve explicación es que el aprendizaje automático requiere menos precisión que las tareas asignadas a las supercomputadoras tradicionales, por lo que las “supercomputadoras de IA” (un poco de marca reciente) pueden realizar más cálculos por segundo que sus hermanos regulares que usan el mismo hardware. Eso significa que cuando Meta dice que ha construido el “más rápido del mundo AI supercomputadora”, no es necesariamente una comparación directa con las supercomputadoras que se ven a menudo en las noticias (clasificaciones que compila la revista independiente Top500.org y publicado dos veces al año).

Para explicar esto un poco más, debe saber que tanto las supercomputadoras como las supercomputadoras de IA realizan cálculos usando lo que se conoce como aritmética de punto flotante, una abreviatura matemática que es extremadamente útil para hacer cálculos usando números muy grandes y muy pequeños (el “coma flotante”). en cuestión es el punto decimal, que “flota” entre cifras significativas). El grado de precisión desplegado en los cálculos de punto flotante se puede ajustar en función de diferentes formatos, y la velocidad de la mayoría de las supercomputadoras se calcula utilizando lo que se conoce como operaciones de punto flotante de 64 bits por segundo o FLOP. Sin embargo, debido a que los cálculos de IA requieren menos precisión, las supercomputadoras de IA a menudo se miden en FLOP de 32 bits o incluso de 16 bits. Es por eso que comparar los dos tipos de sistemas no es necesariamente manzanas con manzanas, aunque esta advertencia no disminuye el increíble poder y la capacidad de las supercomputadoras de IA.

Sorensen también ofrece una advertencia adicional. Como suele ser el caso con el enfoque de “velocidades y avances” para evaluar el hardware, las velocidades máximas alardeadas no siempre son representativas. “Los proveedores de HPC suelen citar números de rendimiento que indican lo más rápido que puede funcionar su máquina. A eso lo llamamos el rendimiento máximo teórico”, dice Sorensen. “Sin embargo, la medida real de un buen diseño de sistema es que pueda ejecutar rápidamente los trabajos para los que está diseñado. De hecho, no es raro que algunos HPC alcancen menos del 25 por ciento de su llamado rendimiento máximo cuando ejecutan aplicaciones del mundo real”.

En otras palabras: la verdadera utilidad de las supercomputadoras se encuentra en el trabajo que realizan, no en su máximo rendimiento teórico. Para Meta, ese trabajo significa construir sistemas de moderación en un momento en que la confianza en la empresa está en su punto más bajo y significa crear una nueva plataforma informática, ya sea basada en gafas de realidad aumentada o el metaverso, que puede dominar frente a rivales como Google, Microsoft y Apple. Una supercomputadora de IA ofrece potencia bruta a la empresa, pero Meta todavía necesita encontrar la estrategia ganadora por su cuenta.

Fuente: The Verge