On savait déjà à quoi elle ressemblait, on connait désormais les performances et la consommation de la GeForce RTX 4090 Founders Edition.

On y est : après de trop longs mois à devoir patienter pour pouvoir enfin mettre la main sur la nouvelle génération de cartes graphiques de NVIDIA, la GeForce RTX 4090 Founders Edition sort enfin de sa cachette pour nous dévoiler tout ce qu’elle a dans le ventre. Présentée officiellement en septembre dernier, aux côtés de la RTX 4080 16G et de la RTX 4080 12G, cette carte graphique represente la vitrine technologique « grand-public » du constructeur, un peu comme les NVIDIA Titan à une époque. C’est d’ailleurs là que réside toute la difficulté d’analyser cette GeForce RTX 4090 Founders Edition : officiellement destinée aux créateurs et aux joueurs, son tarif la pousse plutôt vers la première catégorie alors que la gamme « GeForce » vise le marché gaming. Une carte bien ambigüe donc.

La GeForce RTX 4090 repose sur l’architecture Ada Lovelace de NVIDIA, et profite donc de toutes ses améliorations et nouveautés. Le constructeur a d’ailleurs fortement communiqué sur la hausse de performances en ray-tracing et en DLSS permise par les cœurs RT de 3e génération et de cœurs Tensor de 4e génération. NVIDIA parle ainsi de performances en RT pouvant être multipliées par deux dans le meilleur des cas.

De plus, cette carte graphique profite du DLSS 3.0, une nouvelle version bien plus complexe et performante de la « technologie d’upscaling assisté par IA » de NVIDIA, avec en particulier un Optical Flow Accelerator plus évolué que sur la génération précédente (nous y reviendrons dans un dossier dédié). La RTX 4090 bénéficie également d’un double encodeur AV1 (un codec censé être 40% plus efficace que le H.264) grâce à l’intégration du moteur d’encodage NVENC de huitième génération.

Ada Lovelace en version très haut de gamme

La GeForce RTX 4090 repose sur un GPU AD102-300 gravé en 4 nm (TSMC 4N) et regroupant la bagatelle de 76,3 milliards de transistors. Au complet, un chipset Ada Lovelace embarque 12 Graphic Processing Clusters (GPC) et jusqu’à 144 streaming multiprocessors (SM), soit un total de plus de 18000 coeurs CUDA, avec en sus des performances et une efficacité énergétique améliorées.

Un chipset Ada Lovelace complet

Afin de se garder une autre carte à jouer pour plus tard (qui a dit RTX 4090 Ti au fond ?), NVIDIA n’utilise pas un AD102 complet pour sa GeForce RTX 4090 ; le chipset AD102-300 de cette RTX 4090 ne possède en effet « que » 11 GPC, et deux d’entres eux se voient amputés de deux de leur SM. Au total, on obtient donc 128 streaming multiprocessors fonctionnels, soit 16384 coeurs CUDA.

Le chipset AD102-300 de la RTX 4090

On trouve également 64 Texture Processing Clusters (TPC), 128 coeurs RT de troisième génération, 512 coeurs Tensor de quatrième génération, 512 unités de texturing et 176 ROPs. Le cache L2 total atteint 73728 Ko, et la carte utilise 24 Go de mémoire GDDR6X cadencée à 10501 MHz. Avec un bus mémoire 384-bit, cela représente un taux de transfert de 21 Gbps et une bande passante de 1008 Go/s.

Chaque type de coeur d’Ada Lovelace profite d’améliorations spécifiques. Les SM intègrent par exemple une nouvelle technologie baptisée Shader Execution Reordering (SER) et qui permet de réorganiser les charges de travail à la volée pour optimiser le rendement des unités de calcul, un peu à l’image de la technologie Out-of-Order des processeurs. Cela permet à la RTX 4090 de revendiquer une puissance de calcul de 83 TFLOPS. Les coeurs Tensors utilisent de leur côté le nouveau moteur de transformation Hopper FP8, capable d’atteindre plus de 1,3 PFLOPS de puissance de calcul pour les charges de travail d’inférence. Enfin, les coeurs RT bénéficient de nouveaux moteurs de micro-carte d’opacité et de micro-maillage permettant d’atteindre un débit de triangulation de 191 RT-TFLOPS. A titre de comparaison, Ampere atteint au mieux 78 RT-TFLOPS.

La version Founders Edition de la RTX 4090

Le modèle Founders Edition affiche 2075 grammes sur la balance, pour des dimensions de 30,5 x 13 cm et une épaisseur de 6 cm. C’est clairement imposant, même si on est légèrement en dessous du modèle TUF OC d’Asus.

Le modèle Founders Edition qui sert de support à ce dossier utilise toujours une interface PCI-Express 4.0 ; seul le connecteur d’alimentation 12VHPWR fait réellement partie des spécifications du PCIe Gen5. Le TGP de la carte, 450 watts par défaut, peut être manuellement augmenté jusqu’à 600 watts. A charge ensuite au système de refroidissement de contenir la température du chipset graphique sous les 90°C.

Cette carte occupe trois slots et propose sans véritable surprise quatre sorties vidéo : une HDMI 2.1a et trois DisplayPort 1.4a. On pourra donc légèrement regretter que NVIDIA ne propose pas du DisplayPort 2.0 à la place, alors que le standard existe depuis 2019.

Le démontage de la carte fait apparaitre un PCB compact, aux dimensions similaires à celui de la GeForce RTX 3090 Ti. L’étage d’alimentation se compose de 10 phases au total, avec 20 boucles de contrôle de la tension NVVDD, soit deux en parallèle par phase. A titre de comparaison, la Geforce RTX 3090 Ti utilise 8 phases et 24 convertisseurs de tension, soit trois en parallèle par phase.

L’utilisation d’un tel circuit d’alimentation plutôt qu’un doublement des phases est logique : les fréquences de commutations deviennent si élevées que l’inertie des bobines et des condensateurs commence à poser problème avec un doublement des phases. Cela ne veut hélas pas dire que certains partenaires n’oseront pas tenter le coup pour proposer des cartes moins chères…

Le contrôleur PWM commun aux tensions NVDDD (GPU) et FBVDDQ (VRAM), un MP2891, est l’un des meilleurs contrôleur numérique multi-phase à double rail du marché. Il peut contrôler jusqu’à 16 phases directement sur un seul rail et huit sur le second. Avec respectivement 10 phases et 3 phases (pour la mémoire), on est donc loin de le saturer.

Côté refroidissement enfin, NVIDIA a choisi d’utiliser une chambre à vapeur massive au lieu d’un simple dissipateur thermique en cuivre. Tout comme le GPU, les puces de mémoire sont elles aussi directement en contact avec la chambre à vapeur, et tous les transformateurs de tension profitent bien entendu du système de refroidissement. Les deux ventilateurs de 115 mm sont dotés de sept pales fortement inclinées, avec un design les rendant silencieux tant que l’on reste sous les 1000 tours par minute, et tolérables au delà (jusqu’à 1500 rpm).

GeForce RTX 4090 FE : les performances en jeu

Comme régulièrement, les tests ont été réalisés en partenariat avec nos confrères de chez Igor’s Lab. Si nous nous sommes concentrés sur la partie gaming aujourd’hui, ce dossier sera tout de même prochainement mis à jour pour intégrer les résultats des applications professionnelles. La GeForce RTX 4090 Founders Edition a été opposée aux autres modèles haut de gamme actuels de NVIDIA et d’AMD, de la Radeon RX 6800XT à la RX 6900XT et de la GeForce RTX 3080 10G à la GeForce RTX 3090 Ti, avec le SAM/rBAR activé.

Le panel de jeux utilisés pour mesurer les performances de ces cartes comprend 10 titres récents : Anno 1800, Cyberpunk 2077, Far Cry 6, Horizon Zero Dawn, Marvel’s Guardians of the Galaxy, Metro Exodus EE, Rainbow Six: Extraction, Shadow of the Tomb Raider, A Total War Saga: Troy et Watch Dogs Legion. La majorité de ces titres utilisent l’API DirectX 12, à l’exception de Troy (DirectX 11). Tous les jeux ont été testés en UHD, ainsi qu’en QHD, avec les réglages graphiques les plus élevés possibles. Les tests DLSS ont été regroupés à part.

La plateforme de test utilisée pour mesurer les performances de cette GeForce RTX 4090 FE regroupe un processeur AMD Ryzen 9 7950X, une carte mère MSI MEG X670 Ace, deux barrettes de 16 Go de mémoire DDR5-6000 Corsair Dominator RGB (CL30), deux SSD de 2 To (MSI Spatium M480) et une alimentation Be Quiet Dark Power Pro 12 1500W, le tout placé dans un boîtier Fractal Meshify 2 XL. Un système de watercoling composé d’un Alphacool Apex et d’un Silent Loop II 360 de che Be Quiet! se charge du refroidissement. Le tout fonctionne bien entendu sous Windows 11 Pro 22H2 à jour avec les pilotes les plus récents.

Impossible de le nier : la GeForce RTX 4090 surpasse tout ce qui existe jusqu’à présent sur le marché, et d’une marge très confortable. La RTX 3090 est très loin de la rétroviseur de la nouvelle carte de NVIDIA, avec +51% en moyenne dans notre panel de jeux en QHD. Même les FPS minimum (le centile plus exactement) sont en hausse sensible et atteignent les FPS moyens de la RTX 3090 ou de la Radeon RX 6950XT !

Le constat est identique en 4K, avec des performances qui dépassent ici de 64% en moyenne celles d’une RTX 3090. En d’autres termes, cette RTX 4090 sera tout à fait à l’aise dans n’importe quel jeu récent en 4K, avec tous les paramètres graphiques au maximum. On s’en doutait plus ou moins bien entendu, mais la différence de performances avec l’ancienne génération est clairement visible.

L’activation du DLSS permet d’améliorer encore les performances, en conservant plus ou moins l’avance sur la RTX 3090 (+60%). En moyenne, on passe de 118,5 FPS à 170,2 FPS, mais c’est surtout le P1 qui est particulièrement intéressant : en 2160p avec DLSS, la RTX 4090 est capable d’offrir un framerate minimum de plus de 120 FPS, par tout temps ! Votre écran 4K à 120 Hz va enfin servir à quelque chose…

Consommation

Ces derniers mois, l’une des inquiétudes autour de la GeForce RTX 4090 concernait sa consommation. Nous l’avons donc mesuré avec les mêmes jeux que ci-dessus, et dans les mêmes condition.

La RTX 4090 ne semble pas vraiment forcer en QHD, avec une consommation moyenne de 321 watts dans les jeux de notre panel de test. Compte tenu du framerate bien plus élevé que les autres cartes de notre sélection, le ratio watts/FPS (soit l’efficacité energétique) est excellent : c’est tout simplement le meilleur que l’on n’ait jamais vu !

En UHD, la RTX 4090 commence à réellement montrer toutes ses possibilités, et la consommation augmente forcément. Elle reste toutefois raisonnable, avec 364W en moyenne dans nos 10 jeux. Le ratio watts/FPS atteint par cette carte graphique est tout simplement du jamais vu ; la différence avec les RTX 3080 Ti et Radeon RX 6900XT, en deuxième et troisième position, est presque indécente.

L’utilisation du DLSS permet de diminuer la consommation de la carte en 4K, tout en améliorant le framerate. Au final, l’efficacité énergétique passe sous les 2 watts par FPS en UHD avec cette RTX 4090, une belle performances encore une fois quand on voit qu’aucune autre carte ne passe sous les 3,3 watts par FPS dans les mêmes conditions. Notons au passage que le FSR (ou le XeSS) permet aux Radeon d’améliorer leur ratio watts/FPS, mais elles restent tout de même derrière les GeForce RTX, même de génération Ampere.

DLSS 3 : Cyberpunk 2077

Avec Ada Lovelace, NVIDIA introduit également une nouvelle version du DLSS. Un futur dossier sera dédié au DLSS 3, mais voici déjà un aperçu des performances offertes par cette technologie dans Cyberpunk 2077, en 4K avec ray-tracing et tous les paramètres graphiques au maximum.

Le framerate explose tout simplement tous les records, passant de mois de 100 FPS en DLSS 2.0 à 146 FPS en moyenne ! Cerise sur le gâteau, la RTX 4090 ne descend jamais sous les 120 FPS avec ces paramètres, une chose impossible sans le DLSS 3.0, quelle que soit la carte graphique.

Le DLSS 3.0 est théoriquement censé diminuer la charge CPU, et donc possiblement sa consommation. Nos tests dans Cyberpunk 2077 montrent que ce n’est pas (encore) le cas, et la consommation reste globalement identique par rapport au DLSS 2.0. Formulé autrement, le DLSS 3.0 offre ici un framerate plus élevé, à consommation globale (CPU+GPU) quasi identique.

Le principe de fonctionnement du DLSS 3.0 repose en partie sur la génération en interne d’une image upscalée sur deux à partir de la frame précédente. Autrement dit, le DLSS 3.0 reconstruit 7/8 des pixels de deux frames successives. La latence globale augmente donc de manière logique, et c’est pourquoi la technologie Reflex du constructeur, visant à réduire la latence système, est indispensable.

En pratique, le DLSS 3.0 affiche effectivement une latence plus élevée que le DLSS 2.0, avec environ 10 ms de plus en moyenne dans Cyberpunk 2077. Cela reste raisonnable, mais tout de même mesurable et cela correspond plus ou moins au temps de génération de cette image supplémentaire.

Températures et nuisances sonores

Les fréquences d’horloge en Boost reposent sur différents paliers, selon des plages de température clairement définies. La fréquence de fonctionnement en charge va donc dépendre assez fortement des performances du système de refroidissement.

En jeu, on atteint ainsi 68°C environ pour le GPU, avec un point chaud à 77°C. Les ventilateurs tournent alors à 1400 RPM et les nuisances sonores sont largement tolérables, avec juste un peu moins de 38 dB(A) boîtier ouvert, et 33 à 34 dB(A) boîtier fermé. C’est le modèle Founders Edition le plus silencieux depuis longtemps, malgré son TGP de 450 watts.

RTX 4090 : une Titan déguisée en GeForce

La première image de cette nouvelle architecture Ada Lovelace est clairement positive, avec des performances en hausse sensible dans les jeux, une consommation qui reste « raisonnable » – en tout cas qui n’explose pas d’une génération à une autre – et une excellente efficacité énergétique. On apprécie également les performances offertes par le DLSS 3.0 qui vont permettre de jouer en 4K avec un framerate élevé dans n’importe quel jeu prenant en charge cette technologie. Ce sera d’ailleurs particulièrement intéressant de voir ce que cela donne avec des cartes Ada Lovelace moins puissantes.

Que ce soit en rasterization classique ou en ray-tracing, la GeForce RTX 4090 Founders Edition est tout simplement la carte graphique grand-public la plus rapide du marché, ce qui est de très bonne augure pour le reste de la gamme à venir, avec le lancement en novembre des premières cartes « exclusivement » destinée aux joueurs : les RTX 4080 16G et RTX 4080 12G. En attendant ensuite le débarquement de modèles de milieu, voire d’entrée de gamme, que l’on espère tout autant convaincants.

