Accueil » Actualité » Kirin 950, le CPU le plus rapide sous Android (pour l’instant) » Page 3

Kirin 950, le CPU le plus rapide sous Android (pour l’instant)

1 : Anatomie du Kirin 950 de HiSilicon 2 : Performances CPU

Performances GPU, Conclusion

Passons maintenant aux performances GPU grâce à plusieurs benchmarks synthétiques et pratiques.

SoCKirin 950Exynos 7420Apple A8Apple A9
GPUARM Mali-T880MP4ARM Mali-T760MP8PowerVR GX6450PowerVR GT7600
Nombre de “cores”4846
ALUs FP32 par “core”233232
ALUs FP16 par “core”6464
Total FP32 FLOPS/cycle120160256384
Total FP16 FLOPS/cycle216288512768
Pixels/cycle48812
Texels/cycle48812


Le Kirin 950 utilise un GPU ARM Mali-T880MP4, un modèle doté de trois unités ALU par core là où le Mali-T760 n’en possède que deux. L’architecture Midgard des Mali diffère des autres architectures sur plusieurs points. Ses unités vectorielles SIMD reposent ainsi exclusivement sur un parallélisme au niveau des instructions (ILP) pour garder les différentes ALU actives, alors que les architectures concurrentes utilisent une combinaison ILP et TLP (Thread Level Parallelism). Chaque méthode a ses avantages et ses inconvénients. Le nombre d’IPC est également très variable selon les architectures. Ainsi, les Mali effectuent moins d’opérations par cycle que les PowerVR Rogue et Qualcomm Adreno, mais leur fréquence maximale est plus élevée.

Les différences d’architecture (et de nomenclature) entre les GPU d’ARM et d’Imagination Technologies rendent donc difficile la simple comparaison « sur le papier », d’autant plus que Qualcomm ne publie tout simplement pas les détails de l’architecture de ses propres GPU Adreno. En résumé : rien de mieux que quelques tests pratiques pour départager tous ces prétendants.

Image 1 : Kirin 950, le CPU le plus rapide sous Android (pour l'instant)

Si le GPU du Kirin 950 s’en sort relativement bien dans le premier test de 3D Mark: Ice Storm Unlimited, il souffre beaucoup plus dans le second test, plus lourd. Au final, le Kirin 950 ne parvient à se hisser qu’au-dessus du MT6795 de Mediatek. Le score Physics, qui pourtant est censé tester le CPU et les performances mémoires, est étrangement faible : l’Exynos 7420 du Galaxy S6 fait 31% de mieux que le Kirin 950.

Basemark X utilise le moteur Unity 4.2.2 et tourne sous OpenGL ES 2.0. Ici encore, l’Exynos 7420 et son Mali-T760MP8 sont en moyenne 39% plus rapide que le Kirin 950 et son Mali-T880MP4. Dans le test Dunes qui demande d’afficher de nombreux triangles, le SoC de Samsung est même 73% plus rapide.

En haute qualité, l’écart se creuse encore entre le Mali-T760MP8 et le Mali-T880MP4. Avec huit cores GPU contre quatre, la solution de Samsung est jusqu’à 70% plus rapide (en offscreen).

Le test GFXBench Manhattan faut appel à un moteur de jeu compatible OpenGL ES 3.0 et utilise le Defered Rendering pour les effets de lumière. Le PowerVR GT7600 et l’Adreno 530 montrent les muscles de leur unité ALU, mais même l’Exynos 7420 surpasse le Kirin 950 (de 35%). Le SoC de HiSilicon reste tout de même devant le Snapdragon 808.

Bien qu’utilisant un moteur de rendu un peu plus ancien, en OpenGL ES 2.0, le test T-Rex donne des résultats similaires.

Le nombre limité de ROPs du Kirin 950 le pénalise dans les tests Alpha Blending, permettant même au Snapdragon 808 de passer devant. Notons au passage qu’un problème de pilotes explique le score erratique de l’Exynos 7420 (le score « offscreen » est plus faible que le score « onscreen »).

Conclusion

Le Cortex-A72 est clairement une évolution du Cortex-A57 : à première vue, les deux processeurs sont similaires, mais ARM a apporté un certain nombre d’optimisations et d’améliorations à chaque étage du pipeline. La majorité des calculs entiers ne bénéficient pas d’un gain vraiment important, sauf dans certains cas (encodage par exemple).  La diminution de la latence des unités de calcul en virgule flottante permet en revanche un gain immédiat, comme le montre le test Geekbench.

Malgré ces améliorations, l’architecture du Cortex-A72 d’ARM est toujours plus limitée que celle d’Apple (Twister) ou celle de Qualcomm (Kryo). À fréquence égale, le Kryo est 20% plus rapide en calculs entiers sous Geekbench, et 41% en calculs flottants. Les fréquences plus élevées atteignables par le core A72 permettent toutefois, au moins en partie, de limiter les conséquences de son nombre d’IPC plus faible.

HiSilicon est le premier à proposer du Cortex-A72 gravé en 16nm FinFET+, et le premier à utiliser le nouveau GPU Mali-T880 d’ARM. Cette combinaison affiche une meilleure efficacité énergétique et de meilleures performances que le Snapdragon 810. Le Kirin 950 apparaît même compétitif face au Snapdragon 820, au moins tant qu’on ne fait pas trop appel au GPU.

À première vue, le choix d’utiliser le Mali-T880 dans une configuration quad-core seulement peut paraître étrange, mais un second coup d’œil plus attentif permet de comprendre la logique de HiSilicon : le Kirin 950 est capable de tenir dans les jeux un framerate acceptable, proche de son maximum, sur une longue période. En pratique, associé à un écran 1080p comme celui du Mate 8, ce SoC est plus performant que l’Exynos 7420 du Galaxy S6 qui doit lui rapidement diminuer sa fréquence GPU à cause de la chaleur. Autrement dit, le Kirin 950 ne devrait pas rencontrer de problèmes – de performances ou de surchauffe – en conditions réelles.

En associant un CPU performant et un GPU aux caractéristiques raisonnables offrant tout de même des performances qu’il peut conserver dans le temps sans surchauffer, HiSilicon a donc fait un choix judicieux : celui de l’efficacité énergétique.

Sommaire :

  1. Anatomie du Kirin 950 de HiSilicon
  2. Performances CPU
  3. Performances GPU, Conclusion