En début de semaine, Meta (Facebook), a présenté son nouveau supercalculateur appelé AI Research SuperCluster, en construction depuis deux ans. Selon l’entreprise, RSC fait déjà partie des supercalculateurs d’IA les plus puissants au monde et deviendra le numéro lorsque sa construction sera finalisée à la mi-2022. Il est situé aux États-Unis dans un lieu non précisé.

Ce supercalculateur délivrerait une puissance de calcul LINPACK haute précision de 220 pétaFLOPS mais atteindrait 5 exaFLOPS en précision mixte. Pour la comparaison, le leader actuel du TOP500, Fugaku, culmine à 442 pétaFLOPS mais plafonne à environ 1 exaFLOPS en précision mixte.

Actuellement, RSC s’appuie sur 760 nœuds de calcul NVIDIA DGX A100 comprenant chacun 8 GPU NVIDIA A100, ce qui donne 6080 GPU en tout. À terme, le supercalculateur doit posséder 1240 nœuds, soit 16 000 GPU. Les nœuds DGX sont reliés entre eux par une interconnexion NVIDIA Quantum offrant un débit de 1600 Gb/s. Côté stockage, Meta mentionne 175 pétaoctets de « Pure Storage FlashArray », 10 pétaoctets de « Pure Storage FlashBlade » et enfin 46 pétaoctets de mémoire cache (ce qui donne 231 pétaoctets en tout).

L’accent mis sur la sécurité

Afin de renforcer la sécurité, les données traitées par le supercalculateur sont préalablement « filtrées » par les centres de données Meta. L’entreprise explique :

« RSC a été conçu dès le départ en tenant compte de la confidentialité et de la sécurité, afin que les chercheurs de Meta puissent former des modèles en toute sécurité en utilisant des données cryptées générées par les utilisateurs qui ne sont décryptées qu’au dernier moment. Par exemple, RSC est isolé du reste de l’Internet, sans connexions directes entrantes ou sortantes, et le trafic ne peut provenir que des centres de données de production de Meta.

Pour répondre à nos exigences en matière de confidentialité et de sécurité, l’ensemble du chemin des données de nos systèmes de stockage aux GPU est crypté de bout en bout et dispose des outils et des processus nécessaires pour vérifier que ces exigences sont respectées à tout moment. Avant d’être importées au RSC, les données doivent passer par un processus d’examen de la confidentialité pour confirmer qu’elles ont été correctement anonymisées. Les données sont ensuite cryptées avant de pouvoir être utilisées pour entraîner des modèles d’IA et les clés de décryptage sont supprimées régulièrement pour s’assurer que les anciennes données ne sont pas encore accessibles ».

