NVIDIA et IBM présentent BaM, une alternative à l’API DirectStorage

Rémi Bouvet , le 16 mars 2022

Un cadre d’interopérabilité GPU-SSD plus ouvert que ne l’est l’API de Microsoft.

Pas plus tard qu’hier, Microsoft a annoncé le déploiement de son Direct Storage sur PC Windows 10 / 11. Cette API améliore les temps de chargement dans les jeux en se focalisant sur le transfert de données entre le GPU et le HDD / SDD. Cependant, des chercheurs de NVIDIA, d’IBM et de l’université Cornell proposent une alternative intitulée BaM, pour Big Accelerator Memory.

Image 1 : NVIDIA et IBM présentent BaM, une alternative à l'API DirectStorage

L’article est tout récent puisqu’il date du 9 mars dernier. Pour résumer et vulgariser, BaM permet aux GPU d’aller piocher directement les données dans la mémoire système et le stockage sans passer par le CPU ; elle “émancipe” le GPU du CPU en somme. C’est ce que fait l’API DirectStorage, seulement celle-ci est propriétaire ; les chercheurs définissent ici leur projet comme étant open source.

Au passage, rappelons qu’AMD avait tenté une approche plus ou moins similaire il y a quelques années avec sa Radeon Pro SSG. Sur la page AMD, on peut lire que cette carte embarque 16 Go de mémoire HBM2 mais également 2 To de mémoire graphique à semi-conducteurs (SSG) intégrée.

Jusqu’à 20 % d’amélioration des performances en ray tracing grâce à une technique baptisée ‘GPU Subwarp Interleaving’

Explications complètes

Voici comment les chercheurs présentent leur projet :

“Les accélérateurs tels que les unités de traitement graphique (GPU) sont de plus en plus déployés dans les centres de données modernes en raison de leurs capacités de calcul et de leur bande passante mémoire. Ces accélérateurs s’appuient traditionnellement sur le “code hôte de l’application” et le système d’exploitation fonctionnant sur le CPU pour orchestrer leur accès aux dispositifs de stockage des données. L’orchestration par le CPU des accès aux données de stockage fonctionne bien pour les applications GPU classiques, comme l’apprentissage de réseaux neuronaux denses, où les modèles d’accès aux données sont prédéfinis, réguliers, denses et indépendants des valeurs des données, ce qui permet au CPU de partitionner les données de stockage par paquets et de coordonner les accès aux périphériques de stockage et les transferts de données vers les accélérateurs.

Malheureusement, une telle stratégie centrée sur le CPU entraîne des charges de synchronisation excessives entre le CPU et le GPU et/ou une amplification du trafic d’E/S, ce qui réduit la largeur de bande de stockage effective pour les applications émergentes avec des modèles d’accès dépendant directement des données, comme l’analyse des graphes et des données, les systèmes de recommandation et les réseaux neuronaux en graphes.

Dans cette étude, nous proposons de permettre aux GPU d’orchestrer des accès à haut débit et par petits blocs sur le SSD NVMe dans une nouvelle architecture système appelée BaM. BaM atténue l’amplification du trafic d’E/S en permettant aux threads GPU de lire ou d’écrire de petites quantités de données à la demande […]

Nous montrons que (1) le logiciel d’infrastructure BaM s’exécutant sur les GPU peut identifier et gérer l’échange de petits blocs de données à un taux suffisamment élevé pour utiliser pleinement les dispositifs de stockage sous-jacents, (2) même avec des SSD de qualité grand public, un système BaM peut supporter des performances d’application qui sont compétitives par rapport à une solution DRAM seule beaucoup plus coûteuse, et (3) la réduction de l’amplification des E/S peut apporter un avantage significatif en termes de performances.”

Vous pouvez consulter le rapport compet ici.

Sources : Cornell University via The Register, Tom’s Hardware US

Rémi Bouvet

Pas du tout convaincu que "c'était mieux avant", je préfère m'intéresser à demain plutôt que fantasmer hier.

1 Commentaire

plus ancien

plus récent Le plus populaire

Inline Feedbacks

View all comments

wazarf

3 années il y a

come de toutes manières il faudra attendre des apps et des jeux qui permettent d’exploiter cette techno, et vu que sur PC les configurations sont hétéroclite contrairement aux consoles, ça va mettre un peu de temps à se généraliser.

Les derniers articles

Une Nintendo Switch 2 sans jeux disponibles ? C’est ce qui risque d’arriver
15 juillet 2025 07:23
ROG Xbox Ally : les prix ont fuité, ils font mal au porte-monnaie
15 juillet 2025 06:43
Votre jeu est-il à la traîne ? Le DLSS Swapper 1.2 est là pour tout changer
14 juillet 2025 07:37
Tim Cook ne sera pas démis de ses fonctions à la tête d’Apple
14 juillet 2025 06:54
Windows 11 LTSC 2024 pour seulement 13 € ce 11 juillet : une bonne alternative à Windows 11 Pro ?
11 juillet 2025 09:00
Des processeurs AMD Zen 6 circulent déjà, et il y a une mauvaise nouvelle
11 juillet 2025 07:48
Intel reconnaît des difficultés et un retard face à la concurrence
11 juillet 2025 06:57
Jusqu’à –70 % sur le stockage cloud à vie avec pCloud : une offre à ne pas manquer à l’occasion du 14 juillet !
10 juillet 2025 09:25
Galaxy Z Flip 7 : ce détail vous a échappé, c’est pourtant le plus important
10 juillet 2025 08:02
Apple Vision Pro 2 : le casque serait très largement amélioré par rapport à la première version
10 juillet 2025 07:05

NVIDIA et IBM présentent BaM, une alternative à l’API DirectStorage

Explications complètes

La rédaction vous conseille aussi...