Test AMD Bulldozer : FX-8150

1 : Introduction 2 : Carte-mère : AM3+ obligatoire 3 : Architecture Bulldozer : le concept 4 : Détails de l’architecture (1) 5 : Détails de l’architecture (2) 6 : Performances par core 8 : Le Turbo Core remanié 9 : Feuille de route AMD 2011-2014 10 : AMD Zambezi, Valencia et Interlagos 11 : Configuration de test et benchmarks 12 : Résultats : PCMark 7 13 : Résultats : 3DMark 11 14 : Résultats : Sandra 2011 15 : Résultats : création de contenu 16 : Résultats : bureautique 17 : Résultats : encodage 18 : Résultats : Crysis 2 19 : Résultats : F1 2011 20 : Résultats : World of Warcraft: Cataclysm 21 : Overclocking (refroidissement par air) 22 : Consommation 23 : Premier aperçu de Bulldozer sous Windows 8 24 : Conclusion

Gestion de la consommation

Chaque module Bulldozer est cadencé indépendamment des autres, ce qui signifie qu’on peut se retrouver avec un processeur dont les cores fonctionnent à des fréquences différentes. Cette fonctionnalité est une nouveauté par rapport au Phenom II, dont tous les cores fonctionnaient à la même fréquence (même s’il pouvaient effectivement avoir des p-states, c’est-à-dire des états de veille, différents), mais pas par rapport aux premiers Phenom.

Vous vous souviendrez peut-être que ces différences de fréquences provoquaient à l’époque des problèmes sous Windows Vista lorsque la fonction Cool’n’Quiet était activée : le système d’exploitation tentait de maintenir la symétrie entre cores et faisait donc « sauter » les threads d’un core à l’autre. Pour quoi faire ? Comme nous l’écrivions dans notre article consacré au lancement des Intel Lynnfield :

Pour maintenir la symétrie d’un système à pleine charge, il faut éviter que les requêtes d’entrées/sorties soient concentrées sur un seul cœur. Si l’on fait sauter les threads d’un cœur à l’autre, on gagne en rapidité. Mais ce beau concept vole en éclats lorsque les cœurs inactifs sont mis en semi veille

Cette technologie fut mise au point au cours de la conception du noyau Windows NT, et d’après nos expériences avec les composants d’Intel ou AMD, elle n’était pas considérée comme un atout pour les deux fondeurs. Bien sûr, Intel n’était pas touché de la même manière qu’AMD. Le problème d’Intel avec Vista était la consommation électrique. À chaque migration d’un thread d’un cœur à l’autre, il faut par exemple réécrire le cache L3 d’un processeur Nehalem, ce qui consomme de l’énergie.

Cette situation change avec Windows 7, et une fonction appelée « cœur idéal » (ideal core). Si une tâche de calcul est exécutée par un cœur, le système d’exploitation la laissera là. Cela a deux conséquences pour Intel : d’abord, on ne perd pas d’énergie à migrer le processus, d’autre part, les cœurs inactifs peuvent descendre dans leur état de veille le plus profond, le C6. A priori, ces économies d’énergie devrait permettre de gagner 10 à 15 minutes d’autonomie sur les PC portables équipés de processeurs Nehalem (qui resteront une chimère jusqu’au lancement des CPU Arrandale plus tard cette année). Le corollaire est que les processeurs incapables de descendre en état C6 (et donc les processeurs AMD) ne montreront pas les mêmes gains.

Donc, si les Phenom étaient un peu en avance sur leur temps à cause du scheduler de Windows Vista, il n’en va plus de même des FX sous Windows 7, qui devrait les gérer de manière plus élégante. Au-delà de ce constat, Larry Hewitt, Chief SoC Engineer responsable des processeurs Zambezi, Interlagos et Valencia, affirme que les processeurs reposant sur l’architecture Bulldozer mettent moins de temps à sortir de leur état de veille minimal que les Phenom.

Tout naturellement, nous avons voulu vérifier cette affirmation. Cela ne se voit pas sur le graphique ci-dessus, mais le Phenom II, qui résolvait le problème de migration des threads du Phenom en faisant fonctionner tous ses cores à la même fréquence, ne souffre d’aucun écart de performances sous PCMark 7 lorsque Cool’n’Quiet est activé, ce qui était l’objectif visé. Il en vaut de même pour le FX-8150, ce qui tend à confirmer que les Zambezi et Windows 7 se comportent correctement. L’élément le plus intéressant reste toutefois l’efficacité des optimisations qu’AMD a apportées à l’architecture Bulldozer en termes de consommation. Les lignes bleu et verte sont respectivement celles du FX et du Phenom II X6 lorsque le CnQ est activé. Les lignes noire et rouge sont les mêmes puces avec le CnQ désactivé.

En moyenne, le Phenom II X6 consomme 191 watts avec CnQ et 204 watts sans, soit un écart de 13 watts. Le FX-8150, quant à lui, consomme également 191 watts avec CnQ, mais grimpe à 240 watts lorsqu’il est désactivé. En moyenne, Cool’n’Quiet réduit donc la consommation du système de 49 watts durant notre test, sans affecter les performances !

L’ensemble northbridge / cache L3 est lui aussi cadencé indépendamment du reste du processeur ; il est également alimentés indépendamment. Il semble donc qu’AMD fasse énormément appel au power gating (une fonction lancée par Intel pour ses processeurs Nehalem mais qu’AMD vient seulement d’adopter pour ses APU Llano) pour minimiser les fuites de courant lorsque certaines portions de la puce ne sont pas utilisées.

Comme les Llano, les Zambezi/Interlagos/Valencia prennent enfin en charge l’état de veille C6 par core : lorsque celui-ci est activé, le module Bulldozer concerné voit son cache vidé, son contenu exporté vers la mémoire système et sa tension mise à zéro, ce qui fait donc chuter la consommation et la dissipation thermique du processeur.

La prise en charge de l’état de veille C1E n’est pas une nouveauté chez AMD, mais elle a été améliorée, dans la mesure où tous les modules Bulldozer peuvent être cloisonnés en termes d’alimentation lorsque le northbridge, les liens HyperTransport et la DRAM passent en mode très basse tension.

Sommaire :

  1. Introduction
  2. Carte-mère : AM3+ obligatoire
  3. Architecture Bulldozer : le concept
  4. Détails de l’architecture (1)
  5. Détails de l’architecture (2)
  6. Performances par core
  7. Gestion de la consommation
  8. Le Turbo Core remanié
  9. Feuille de route AMD 2011-2014
  10. AMD Zambezi, Valencia et Interlagos
  11. Configuration de test et benchmarks
  12. Résultats : PCMark 7
  13. Résultats : 3DMark 11
  14. Résultats : Sandra 2011
  15. Résultats : création de contenu
  16. Résultats : bureautique
  17. Résultats : encodage
  18. Résultats : Crysis 2
  19. Résultats : F1 2011
  20. Résultats : World of Warcraft: Cataclysm
  21. Overclocking (refroidissement par air)
  22. Consommation
  23. Premier aperçu de Bulldozer sous Windows 8
  24. Conclusion