Récemment — un peu avant l'officialisation de la PlayStation 4 qui utilise un CPU de ce type —, AMD a parlé du CPU Jaguar, le successeur de Bobcat. Bobcat est la première architecture basse consommation d'AMD, un CPU x86 destiné à concurrencer l'Atom d'Intel et un peu plus rapide que ce dernier.
Plus petit, plus rapide
Premièrement, Jaguar est plus petit que Bobcat, en partie grâce au passage en 28 nm : on passe de 4,9 mm² à 3,1 mm². En comparaison, un cluster de quatre cores Cortex A7 et sa mémoire cache mesurent 3,8 mm² chez Samsung. La configuration de base d'un APU AMD intègre quatre cores Jaguar, chacun doté de 512 ko de mémoire cache (comme Bobcat) et de 2x 32 ko de cache de niveau 1 (là aussi comme Bobcat). Si le cache est plus rapide, avec notamment des systèmes de préchargement des données, AMD a par contre modifié la gestion de la mémoire : on passe d'un cache exclusif (deux caches séparés) à un cache inclusif (comme chez Intel) où les données des caches de niveau 1 sont répliquées dans les caches de niveau 2. Autre petite modification, le bus d'adressage mémoire passe de 36 à 40 bits (de 64 Go à 1 To de mémoire au maximum), ce qui n'a pas réellement d'impact dans la pratique.
Notons aussi l'intégration des instructions SSE4.1 et SSE4.2, des instructions dédiées à l'AES et d'une amélioration globale des performances. AMD parle de performances 15 % plus élevées que celles de Bobcat à fréquence identique, d'une fréquence finale un peu plus élevée — 1,85 GHz contre au mieux 1,7 GHz sur Bobcat — et d'une consommation en diminution.
Dans la PlayStation 4, AMD proposera une version 8 cores de la puce, avec une fréquence attendue de 1,6 GHz. Notons que si l'IPC reste faible sur Bobcat, c'est aussi le cas du processeur PowerPC intégré dans le Cell de la PlayStation 3, qui n'a jamais brillé par ses performances. Reste que même avec des optimisations, Jaguar reste assez loin des cores classiques et plus modernes : un simple Core i3 Ivy bridge devrait offrir des performances équivalentes, sans parler des futurs Haswell et des versions plus évoluées des Core ix d'Intel ou des autres cores d'AMD.

J'imagine que c'est grâce aux faible prix d'AMD et pour lui redonner un peu de souffle.
je ne comprends pas ta phrase car tu dis que la puissance sera moins important pour une puissance égale.
Je n'ai pas vraiment tout compris de l'article surtout quand on parle de mémoire niveau 1 et niveau 2.
Pour le reste je pense qu'on ne peut comparer la puissance d'une console face à celle d'un ordinateur car le système d'exploitation sur le second "pompe" énormément de puissance.
Soit ce que tu dis, soit une optimisation des (futurs) jeux aux travaux massivement parallèles.
Comme avec HSA, la tâche sera effectué sur l'unité de calcul la plus appropriée, ainsi CPU que shader GPU capable C++. Enfin, cela n'importera plus que les i3 sont plus performants pour soi, quand plusieurs unités moins performantes mais plus efficaces achèvent le job plus rapidement et moins consommant.
C'est le début d'un changement de paradigme.
D'ailleurs, notons que les GPUs d'Intel restent encore de quelques années à la traine...
Non pas vraiment d'impact, ça leur permet juste de le placer dans le marché des serveurs en face des solutions ARM....
Pour le cache : avant AMD avait un cache exclusif: t'as un L1 de 64 ko et un L2 de 512 ko dans chaque core, les données sont différentes dans les caches. T'as donc 512 ko + 64 ko de cache par core de disponible.
Maintenant, c'est inclusif, les données du 1 sont dans le 2 (et potentiellement dans un 3) : t'as donc 512 ko de cache au total (512 ko - 64 ko (recopié) + 64 ko) par core.
Pour moi c'est dans l'architecture du cache qu'il y a un gros progrès et dans le GPU qu'ils doivent également se concentrer (trop nombreux freezes sur la PS3 à moins qu'il ne s'agisse d'un manque d'optimisation de certains jeux). Cela dit, j'aimerais savoir ce qui se stocke en cache pour comprendre en quoi ce nouveau processeur est plus intéressant.
Étant donnée que les CPU modernes sont tous Out of Order, je doute que le développeur puisse choisir les instructions à faire apparaitre dans le cache ni, par conséquent, les données qui leurs sont nécessaires. Comme je le disais, les CPU ont des unités spécialisés dans la prédiction d'instruction et de donnée. Une intervention humaine poserait, je penses, plus de soucis.
C'est comme pour tout, il y a du pour et du contre, des avantages et des inconvénients.
Au bout du compte, avec l'augmentation de taille des caches les plus "externes" (L3 est "externe" à L2 et L2 à L1), la solution "cache inclusif" compense assez la "perte" de capacité par le gain de temps sur sa gestion pour que cette option soit plus performante que le cache exclusif.