Test AMD Bulldozer : FX-8150

1 : Introduction 2 : Carte-mère : AM3+ obligatoire 3 : Architecture Bulldozer : le concept 4 : Détails de l’architecture (1) 5 : Détails de l’architecture (2) 6 : Performances par core 7 : Gestion de la consommation 8 : Le Turbo Core remanié 9 : Feuille de route AMD 2011-2014 11 : Configuration de test et benchmarks 12 : Résultats : PCMark 7 13 : Résultats : 3DMark 11 14 : Résultats : Sandra 2011 15 : Résultats : création de contenu 16 : Résultats : bureautique 17 : Résultats : encodage 18 : Résultats : Crysis 2 19 : Résultats : F1 2011 20 : Résultats : World of Warcraft: Cataclysm 21 : Overclocking (refroidissement par air) 22 : Consommation 23 : Premier aperçu de Bulldozer sous Windows 8 24 : Conclusion

AMD Zambezi, Valencia et Interlagos

AMD emploie le même die pour tous les nouveaux processeurs basés sur l’architecture Bulldozer, qu’ils visent le marché du desktop (Zambezi), des serveurs à un ou deux processeurs (Valencia) ou des serveurs à un à quatre processeurs (Interlagos). Cette approche n’a bien entendu rien de neuf ni de surprenant : AMD et Intel commercialisent couramment des puces similaires sur plusieurs marchés différents.

Cette première incarnation de la nouvelle microarchitecture d’AMD contient quatre modules Bulldozer et donc huit cores. Les caractéristiques de la puce sont donc faciles à déterminer : 128 Ko de cache L1 pour les données (16 Ko par core x 8), 256 Ko de cache L1 pour les instructions (64 Ko par module x 4) et 8 Mo de cache L2 (2 Mo par module x 4).

Le die comporte également 8 Mo de cache L3 partagé (quatre tranches de mémoire de 2 Mo chacune). Il est totalement inhabituel de voir un cache L3 de la même taille que le cache L2, mais selon AMD, cette structure résulte d’analyses qui ont indiqué qu’il s’agissait du rapport optimal. Le fondeur indique par ailleurs que le cache L3 n’a qu’une influence minime dans les configurations de bureau ; sa présence se ressent plus dans les serveurs.

Remontons d’une génération : le Phenom II contenait 512 Ko de cache L2 par core et un cache L3 partagé de 6 Mo. Les Sandy Bridge comptent 256 Ko de cache L2 par core et jusqu’à 8 Mo de cache L3 Cette hiérarchie en pyramide est généralement considérée comme idéale pour alimenter chaque niveau aussi rapidement que possible ; en dépit des assurances d’AMD, l’organisation des caches du Bulldozer semble donc intuitivement mauvaise.

Il y a toutefois une différence de taille entre le cache L3 du Bulldozer et celui du Sandy Bridge : le premier est exclusif alors que le second est inclusif. Cela signifie que, sur le Bulldozer, les données ne doivent pas se trouver simultanément dans le L2 et dans le L3 ; les caches des processeurs AMD FX sont donc à même de stocker plus d’informations. Les données se trouvant dans le L3 sont tout simplement plus éloignées des cores.

Pris en sandwich entre deux tranches de cache L3, on trouve le northbridge intégré, qui gère les communications entre le cache L3, les deux canaux de 72 bits de mémoire DDR3 et les liaisons HyperTransport 16 bits, au nombre de quatre maximum. En version pour ordinateur de bureau, le northbridge est cadencé à 2,2 GHz maximum ; les versions pour serveurs le seront à 2,0 et 2,2 GHz.

Comme on le voit sur le diagramme ci-dessus, la System Request Queue et le Crossbar du northbridge reçoivent les transactions d’un module Bulldozer, vérifient le cache L3, les dirigent vers le contrôleur mémoire puis renvoient les données au module qui les a demandées. Outre ces sous-systèmes, le northbridge gère les transactions provenant du chipset et, dans les configuration à plusieurs processeurs, des autres sockets.

Zambezi

Tous les processeurs de bureau basés sur l’architecture Bulldozer actuellement disponibles sont des Zambezi. Ces puces sont prévues pour le socle AM3+ (mais pas pour l’AM3), qui ajoute quelques optimisations liées à l’alimentation du processeur et un courant plus élevé pour les liaisons HyperTransport (qui sont donc plus rapides) ainsi que pour la mémoire à plus haute vitesse.

Concernant la mémoire, justement, les Zambezi gèrent deux canaux de DDR3-1866, alors que les processeurs de la génération précédente plafonnaient à la DDR3-1333. Même chose pour l’HyperTransport, qui passe de 2 GHz (4 GT/s) à 2,6 GHz (5,2 GT/s).  

Valencia

Les processeurs Valencia sont destinés aux serveurs à un ou deux processeurs. Leur die est exactement identique à celui des Zambezi ; seule leur infrastructure diffère.

Ils remplacent les Opteron 4000 Lisbon, gravés en 45 nm ; comme ceux-ci, ils se branchent sur un socket C32. Seule une mise à jour du BIOS est nécessaire pour les prendre en charge.

Comme les Zambezi, les Valencia gèrent deux canaux de mémoire, mais étant orientés « entreprises », ils sont compatibles avec les barrettes de type Unregistered DIMM, Registered DIMM et Load-Reduced DIMM en DDR3-1600. Leurs liaisons HyperTransport sont quant à elles plus rapides (6,4 GT/s) afin de mieux gérer les communications entre sockets.

Interlagos

Bien que la plupart des documents de référence considèrent les Interlagos comme des processeurs à 16 cores, il s’agit en réalité de packages à deux dies conçus pour les serveurs comptant un à quatre sockets. À l’intérieur de ce package, on trouve deux modules Bulldozer reliés entre eux par une liaison HyperTransport et communicant avec l’extérieur par quatre autres cadencées à 6,4 GT/s.

Combinés, ces deux dies offrent donc jusqu’à 16 Mo de cache L2 et autant de L3 ainsi que quatre canaux de mémoire gérant les barrettes Unregistered DIMM, Registered DIMM et Load-Reduced DIMM en DDR3-1866.

Ils remplacent les Opteron 6000 Magny-Cours gravés en 45 nm et, comme eux, se branchent sur un socket G34. Leur prise en charge ne nécessite qu’une mise à jour du BIOS.

Sommaire :

  1. Introduction
  2. Carte-mère : AM3+ obligatoire
  3. Architecture Bulldozer : le concept
  4. Détails de l’architecture (1)
  5. Détails de l’architecture (2)
  6. Performances par core
  7. Gestion de la consommation
  8. Le Turbo Core remanié
  9. Feuille de route AMD 2011-2014
  10. AMD Zambezi, Valencia et Interlagos
  11. Configuration de test et benchmarks
  12. Résultats : PCMark 7
  13. Résultats : 3DMark 11
  14. Résultats : Sandra 2011
  15. Résultats : création de contenu
  16. Résultats : bureautique
  17. Résultats : encodage
  18. Résultats : Crysis 2
  19. Résultats : F1 2011
  20. Résultats : World of Warcraft: Cataclysm
  21. Overclocking (refroidissement par air)
  22. Consommation
  23. Premier aperçu de Bulldozer sous Windows 8
  24. Conclusion