Accueil » Actualité » Kirin 950, le CPU le plus rapide sous Android (pour l’instant) » Page 2

Kirin 950, le CPU le plus rapide sous Android (pour l’instant)

1 : Anatomie du Kirin 950 de HiSilicon 3 : Performances GPU, Conclusion

Performances CPU

Maintenant que vous connaissez un peu mieux les entrailles du Kirin 950, découvrons ses performances, tant au niveau CPU que GPU, via une série de tests (synthétiques et avec des applications réelles).

Image 1 : Kirin 950, le CPU le plus rapide sous Android (pour l'instant)

Si le Kirin 950 affiche un bon score global sous Basemark OS II v2.0, la partie GPU est en revanche en difficulté, avec un score largement en dessous de celui de l’Apple A9 ou des Snapdragon 820/810/808. En OpenGL ES 2.0, le score du Mali-T760MP8 intégré à l’Exynos 7420 (que l’on trouve par exemple dans le Galaxy S6) dépasse même de 54% celui du Mali-T880MP4 présent dans le Kirin 950…

Côté CPU, le Kirin 950 reprend fort heureusement du poil de la bête et ne se laisse distancer que par l’Apple A9 et son CPU Twister, ce dernier bénéficiant d’un nombre d’IPC (instructions par cycle d’horloge) plus élevé. Avec ses huit cores, le Kirin 950 fait 7% de mieux que le Snapdragon 820, alors que le CPU Kryo de celui-ci ne possède que quatre cores, cadencés à une fréquence maximale inférieure qui plus est.

Le Kirin 950 affiche le meilleur score que nous ayons jusqu’à présent vu sous AndEBench, devant l’Exynos 7420, le Snapdragon 820 ou le Snapdragon 808 (+30%). Son avance vient principalement du test CPU CoreMark-HPC où il affiche un score supérieur de 29% à celui de l’Exynos 7420 et de 34% à celui du Snapdragon 820. Le Snapdragon 810 arrive derrière le Snapdragon 808, pourtant équipé de deux cores Cortex-A57 en moins : gravé en 20 nm, le Snapdragon 810 n’est pas capable de faire fonctionner ses quatre cores A57 de manière durable et doit donc basculer sur les cores A53, moins gourmands mais également moins performants. Grâce à sa gravure en 16nm FinFET+ et sa gestion optimisée de l’énergie, le Kirin 950 n’a pas ce problème.

La suite de tests synthétiques Geekbench permet de mettre clairement en relief les différences de nombre d’IPC entre les différents cores A72, A57 ou Kryo. De manière globale, un core A72 est 16% plus rapide qu’un core A57 en calculs entiers (un chiffre que l’on peut ramener à +6% à fréquence égale). L’avance atteint 25% (+15% à fréquence identique) en calculs flottants. Les améliorations du core Cortex-A72 ne sont toutefois pas suffisantes pour rattraper le core Kryo du Snapdragon 820 qui est 12% plus rapide (et même 20% si l’on compare à fréquence équivalente) en calculs entiers, et 32% (+41% à fréquence identique) en calculs flottants.

Geekbench 3 Pro – Calculs entiers*

TestKirin 950Exynos 7420Snapdragon 820
AES (single-core)848694(22.2%)796(6.5%)
AES (multi-core)33283568(-6.7%)2281(45.9%)
Twofish (single-core)19441741(11.7%)2128(-8.6%)
Twofish (multi-core)85598026(6.6%)6144(39.3%)
SHA1 (single-core)79576433(23.7%)9063(-12.2%)
SHA1 (multi-core)2866626286(9.1%)27406(4.6%)
SHA2 (single-core)23502118(11.0%)3111(-24.5%)
SHA2 (multi-core)1219010113(20.5%)8845(37.8%)
BZip2 Compress (single-core)16711397(19.6%)1808(-7.6%)
BZip2 Compress (multi-core)64245693(12.8%)5099(26.0%)
BZip2 Decompress (single-core)16711579(5.8%)1805(-7.4%)
BZip2 Decompress (multi-core)80926697(20.8%)4474(80.9%)
JPEG Compress (single-core)15841441(9.9%)1813(-12.6%)
JPEG Compress (multi-core)75577314(3.3%)5332(41.7%)
JPEG Decompress (single-core)20771932(7.5%)2504(-17.1%)
JPEG Decompress (multi-core)86687552(14.8%)6917(25.3%)
Sobel (single-core)16991539(10.4%)2404(-29.3%)
Sobel (multi-core)74387313(1.7%)6680(11.3%)
Lua (single-core)19781408(40.5%)1789(10.6%)
Lua (multi-core)79476672(19.1%)5139(54.6%)
Dijkstra (single-core)12881073(20.0%)1565(-17.7%)
Dijkstra (multi-core)47994768(0.7%)3923(22.3%)

*Les pourcentages entre parenthèses sont normalisés à fréquence équivalente

En regardant plus en détail les résultats des tests « calculs entiers » dans Geekbench, on s’aperçoit que certains d’entre eux (BZip2 Decompress, Sobel ou encore les tests JPEG) ne montrent aucune amélioration de performances entre le Cortex-A72 et le Cortex A-57 (toujours à fréquence identique, bien entendu). Ce n’est pas une véritable surprise étant donné que les unités d’exécution « entiers » sont similaires entre ces deux cores, mis à part une nouvelle unité de division d’entiers Radix-16 et une unité CRC 1-cycle. Les améliorations apportées aux prédictions de branchement ne sont elles aussi presque d’aucune utilité sous Geekbench, les opérations mathématiques se résumant à de courtes boucles.

D’autres tests (Lua, Dijkstra, AES et SHA1) semblent en revanche tirer parti des améliorations apportées au core A72, en particulier sa plus grande bande passante mémoire. Le core Kryo de Qualcomm est quant à lui devant l’A72 dans les calculs entiers : il possède lui aussi une seule unité multiplication/division d’entiers, mais bénéficie d’une latence de 3 cycles seulement, contre 4 cycles pour les cores d’ARM.

Si le nombre d’IPC est toujours le meilleur indicateur de performances pour comparer des cores entre eux, les performances multi-cores deviennent de plus en plus importantes sous Android. Et à ce petit jeu, l’Exynos 7420 s’en sort mieux que le Kirin 950. Ceci est probablement la faute de l’interconnexion CCI-400 qui limite les performances des cores Cortex-A72. Il sera donc intéressant de tester un SoC équipé de cores A72 et d’une interconnexion CCI-500, recommandée par ARM.

Geekbench 3 Pro – Calculs flottants*

TestKirin 950Exynos 7420Snapdragon 820
BlackScholes (single-core)18931240(52.7%)2345(-19.3%)
BlackScholes (multi-core)83545663(47.5%)6944(20.3%)
Mandelbrot (single-core)20261178(72.0%)1947(4.1%)
Mandelbrot (multi-core)89736027(48.9%)6051(48.3%)
Sharpen Filter (single-core)18941599(18.4%)2828(-33.0%)
Sharpen Filter (multi-core)90616755(34.1%)8537(6.1%)
Blur Filter (single-core)16811440(16.7%)3297(-49.0%)
Blur Filter (multi-core)80256430(24.8%)9207(-12.8%)
SGEMM (single-core)1087953(14.1%)1440(-24.5%)
SGEMM (multi-core)36882847(29.5%)3136(17.6%)
DGEMM (single-core)818875(-6.5%)1350(-39.4%)
DGEMM (multi-core)32742383(37.4%)3101(5.6%)
SFFT (single-core)14021365(2.7%)1901(-26.2%)
SFFT (multi-core)65264815(35.5%)5306(23.0%)
DFFT (single-core)14161236(14.6%)1870(-24.3%)
DFFT (multi-core)50193827(31.1%)5212(-3.7%)
N-Body (single-core)20801406(47.9%)2255(-7.8%)
N-Body (multi-core)77914956(57.2%)6128(27.1%)
Ray Trace (single-core)23021660(38.7%)2429(-5.2%)
Ray Trace (multi-core)93666056(54.7%)7059(32.7%)

*Les pourcentages entre parenthèses sont normalisés à fréquence équivalente

Les nouvelles unités de calculs flottants et SIMD du core Cortex-A72, bénéficient d’un pipeline plus court permettant de réduire les latences jusqu’à 40%. Ce core intègre également un nouveau diviseur Radix-16 FP plus efficace, doublant la bande passante. Ces améliorations permettent au core A72 d’afficher des performances en hausse par rapport à celles du core Cortex A-57. Mis à part dans les tests DGEMM et SFFT, l’A72 fait entre 4% et 57% mieux que l’A57, à fréquence identique.

Pour le Kryo, Qualcomm a fait des performances en calcul à virgule flottante une priorité. L’architecture de ce SoC ressemble en ce sens au core Typhoon d’Apple. Du coup, l’A72 est derrière lui de près de 41%, une fois que l’on a réajusté les résultats à fréquence identique.

Contrairement à Geekbench, les tests PCMark mesurent plutôt les performances de l’appareil ou de la plateforme dans son ensemble (CPU, mémoire et système de stockage). Le Mate 8 et son SoC Kirin 950 arrive en tête, dépassant de 12% le Moto X Pure Edition (Snapdragon 808) et de 24% le Galaxy S6 (Exynos 7420).

Le Mate 8 affiche également de très bons résultats dans nos tests JavaScript (Browsermark, JSBench, Google Octane), dépassant de 27% en moyenne le Galaxy S6 et étant au coude à coude avec le Snapdragon 820.

Sommaire :

  1. Anatomie du Kirin 950 de HiSilicon
  2. Performances CPU
  3. Performances GPU, Conclusion