L’architecture GPU Pascal en détail : priorité aux applications GPGPU

David Civera , le 6 avril 2016

Si l’on se penche sur l’architecture Pascal présentée aujourd’hui pour le Tesla P100, on remarque qu’elle donne la priorité aux applications GPGPU au détriment des jeux et du grand public.

L’architecture Pascal (GP100)

Après sa conférence de presse présentant la première puce Pascal, la Tesla P100, NVIDIA a donné plus de détail sur son architecture. Parmi les nouveautés, on notera que la nouvelle finesse de gravure permet d’accroître le nombre de Stream Multiprocessors (SM) disponibles. Chaque SM regroupe 64 coeurs CUDA et quatre unités de textures. L’architecture peut monter jusqu’à 3 840 coeurs CUDA et 240 unités de texture, soit un total de 60 SM.

– Comparatif : les cartes graphiques du moment au banc d’essai

Priorité aux applications GPGPU

Chaque SM a moins de coeurs CUDA et d’unités de texture que sur les Kepler, mais le ratio FP64/FP32 est nettement supérieur. Concrètement, cela signifie que la puce privilégie les applications GPGPU. L’autre grande nouveauté est la priorité donnée à la mémoire. La puce Pascal a deux fois moins de coeurs CUDA que la puce Maxwell GM200, mais on retrouve la même taille de bancs de registre par SM. Comme Pascal a nettement plus de SM, on se retrouve avec une puce ayant des bancs de registre plus grands et une plus grande mémoire partagée, ce qui sera intéressant lorsque l’on traite une très grande quantité de données à la fois. Bref, le GP100 est clairement tourné vers l’apprentissage automatique, l’intelligence artificielle et les opérations GPGPU. NVIDIA estime que l’augmentation du nombre de SM sera suffisante pour apporter un gain de performance acceptable dans les jeux. La réponse devrait arriver avec les GeForce GTX 1080, qui pourrait aussi embarquer une puce légèrement modifiée pour les jeux.

Caractéristiques	Tesla K40	Tesla M40	Tesla P100
GPU	GK110 (Kepler)	GM200 (Kepler)	GP100 (Pascal)
Finesse	28 nm	28 nm	16 nm
Transistors	7,1 milliards	8 milliards	15,3 milliards
Taille du die	551 mm²	601 mm²	610 mm²
Stream Multiprocessors (SM)	15	24	56
Coeur CUDA / SM	192	128	64
Unités de texture / SM	16	8	4
FP32 Cores CUDA / GPU	2 880	3 072	3 584
Ratio FP64/FP32	1/3	1/32	1/2
Fréquences de base	745 MHz	948 MHz	1 328 MHz
Fréquence boost	875 MHz	1 114 MHz	1 480 MHz
Puissance en double précision (FP64) en TFLOPS	1,680	0,192	5,304
Bus mémoire	384 bits GDDR5	384 bits GDRR5	4 096 bits HBM2
Mémoire	Jusqu’à 12 Go	Jusqu’à 24 Go	16 Go
Cache L2	1,5 Mo	3 Mo	4 Mo
Taille des bancs de registre	4 Mo	6 Mo	14 Mo
TDP	235 W	250 W	300 W

NVIDIA

David Civera

Twitter

Né aux États-Unis, élevé en France et à Singapour, adopté par les Philippines, et maintenant…

Les commentaires sont fermés.

Les derniers articles

Voici comment le FSR 4 va booster la PS5 Pro à partir de 2026
3 juillet 2025 07:56
La Nintendo Switch 2 s’est vendue comme des petits pains en juin
3 juillet 2025 07:04
Jusqu’à –70 % sur le stockage cloud à vie avec pCloud : une offre à ne pas manquer à l’occasion du 14 juillet !
2 juillet 2025 13:30
TSMC en route vers un chiffre d’affaires record en 2026
2 juillet 2025 07:41
Nvidia annonce de grosses nouveautés pour ces jeux-vidéos sur PC
2 juillet 2025 06:34
Test de l’aspirateur laveur Eureka Rapidwash 730 : est-il vraiment sans pitié avec la saleté ?
1 juillet 2025 17:58
Votre débit internet en avion va bientôt augmenter, voici pourquoi
1 juillet 2025 07:36
Android 16 ajoute cette nouveauté pour lutter contre les cyberattaques
1 juillet 2025 06:53
Test Asus TUF Radeon RX 9070 : une carte graphique légère mais performante
30 juin 2025 18:24
Adoptez une souris ergonomique : un petit changement pour un grand mieux dans votre quotidien pro
30 juin 2025 11:05

L’architecture GPU Pascal en détail : priorité aux applications GPGPU

Priorité aux applications GPGPU

La rédaction vous conseille aussi...