Dijkstra (multi-core)<\/strong><\/th>4799<\/td> 4768<\/td> (0.7%)<\/td> 3923<\/td> (22.3%)<\/td><\/tr><\/tbody><\/table><\/div>\n\n*Les pourcentages entre parenth\u00e8ses sont normalis\u00e9s \u00e0 fr\u00e9quence \u00e9quivalente<\/em><\/p>\n\n<\/p>\n\n
En regardant plus en d\u00e9tail les r\u00e9sultats des tests \u00ab\u00a0calculs entiers\u00a0\u00bb dans Geekbench, on s\u2019aper\u00e7oit que certains d\u2019entre eux (BZip2 Decompress, Sobel ou encore les tests JPEG) ne montrent aucune am\u00e9lioration de performances entre le Cortex-A72 et le Cortex A-57 (toujours \u00e0 fr\u00e9quence identique, bien entendu). Ce n\u2019est pas une v\u00e9ritable surprise \u00e9tant donn\u00e9 que les unit\u00e9s d\u2019ex\u00e9cution \u00ab\u00a0entiers\u00a0\u00bb sont similaires entre ces deux cores, mis \u00e0 part une nouvelle unit\u00e9 de division d\u2019entiers Radix-16 et une unit\u00e9 CRC 1-cycle. Les am\u00e9liorations apport\u00e9es aux pr\u00e9dictions de branchement ne sont elles aussi presque d\u2019aucune utilit\u00e9 sous Geekbench, les op\u00e9rations math\u00e9matiques se r\u00e9sumant \u00e0 de courtes boucles.<\/p>\n\n
<\/p>\n\n
D\u2019autres tests (Lua, Dijkstra, AES et SHA1) semblent en revanche tirer parti des am\u00e9liorations apport\u00e9es au core A72, en particulier sa plus grande bande passante m\u00e9moire. Le core Kryo de Qualcomm est quant \u00e0 lui devant l\u2019A72 dans les calculs entiers\u00a0: il poss\u00e8de lui aussi une seule unit\u00e9 multiplication\/division d\u2019entiers, mais b\u00e9n\u00e9ficie d\u2019une latence de 3 cycles seulement, contre 4 cycles pour les cores d\u2019ARM.<\/p>\n\n
<\/p>\n\n
Si le nombre d’IPC est toujours le meilleur indicateur de performances pour comparer des cores entre eux, les performances multi-cores deviennent de plus en plus importantes sous Android. Et \u00e0 ce petit jeu, l’Exynos 7420 s’en sort mieux que le Kirin 950. Ceci est probablement la faute de l\u2019interconnexion CCI-400 qui limite les performances des cores Cortex-A72. Il sera donc int\u00e9ressant de tester un SoC \u00e9quip\u00e9 de cores A72 et d’une interconnexion CCI-500, recommand\u00e9e par ARM. <\/p>\n\n
<\/p>\n\n
Geekbench 3 Pro – Calculs flottants*<\/strong><\/p>\n\n<\/p>\n\n
Test<\/strong><\/th>Kirin 950<\/strong><\/th>Exynos 7420<\/strong><\/th>Snapdragon 820<\/strong><\/th><\/tr>BlackScholes (single-core)<\/strong><\/th>1893<\/td> 1240<\/td> (52.7%)<\/td> 2345<\/td> (-19.3%)<\/td><\/tr> BlackScholes (multi-core)<\/strong><\/th>8354<\/td> 5663<\/td> (47.5%)<\/td> 6944<\/td> (20.3%)<\/td><\/tr> Mandelbrot (single-core)<\/strong><\/th>2026<\/td> 1178<\/td> (72.0%)<\/td> 1947<\/td> (4.1%)<\/td><\/tr> Mandelbrot (multi-core)<\/strong><\/th>8973<\/td> 6027<\/td> (48.9%)<\/td> 6051<\/td> (48.3%)<\/td><\/tr> Sharpen Filter (single-core)<\/strong><\/th>1894<\/td> 1599<\/td> (18.4%)<\/td> 2828<\/td> (-33.0%)<\/td><\/tr> Sharpen Filter (multi-core)<\/strong><\/th>9061<\/td> 6755<\/td> (34.1%)<\/td> 8537<\/td> (6.1%)<\/td><\/tr> Blur Filter (single-core)<\/strong><\/th>1681<\/td> 1440<\/td> (16.7%)<\/td> 3297<\/td> (-49.0%)<\/td><\/tr> Blur Filter (multi-core)<\/strong><\/th>8025<\/td> 6430<\/td> (24.8%)<\/td> 9207<\/td> (-12.8%)<\/td><\/tr> SGEMM (single-core)<\/strong><\/th>1087<\/td> 953<\/td> (14.1%)<\/td> 1440<\/td> (-24.5%)<\/td><\/tr> SGEMM (multi-core)<\/strong><\/th>3688<\/td> 2847<\/td> (29.5%)<\/td> 3136<\/td> (17.6%)<\/td><\/tr> DGEMM (single-core)<\/strong><\/th>818<\/td> 875<\/td> (-6.5%)<\/td> 1350<\/td> (-39.4%)<\/td><\/tr> DGEMM (multi-core)<\/strong><\/th>3274<\/td> 2383<\/td> (37.4%)<\/td> 3101<\/td> (5.6%)<\/td><\/tr> SFFT (single-core)<\/strong><\/th>1402<\/td> 1365<\/td> (2.7%)<\/td> 1901<\/td> (-26.2%)<\/td><\/tr> SFFT (multi-core)<\/strong><\/th>6526<\/td> 4815<\/td> (35.5%)<\/td> 5306<\/td> (23.0%)<\/td><\/tr> DFFT (single-core)<\/strong><\/th>1416<\/td> 1236<\/td> (14.6%)<\/td> 1870<\/td> (-24.3%)<\/td><\/tr> DFFT (multi-core)<\/strong><\/th>5019<\/td> 3827<\/td> (31.1%)<\/td> 5212<\/td> (-3.7%)<\/td><\/tr> N-Body (single-core)<\/strong><\/th>2080<\/td> 1406<\/td> (47.9%)<\/td> 2255<\/td> (-7.8%)<\/td><\/tr> N-Body (multi-core)<\/strong><\/th>7791<\/td> 4956<\/td> (57.2%)<\/td> 6128<\/td> (27.1%)<\/td><\/tr> Ray Trace (single-core)<\/strong><\/th>2302<\/td> 1660<\/td> (38.7%)<\/td> 2429<\/td> (-5.2%)<\/td><\/tr> Ray Trace (multi-core)<\/strong><\/th>9366<\/td> 6056<\/td> (54.7%)<\/td> 7059<\/td> (32.7%)<\/td><\/tr><\/tbody><\/table><\/div>\n\n*Les pourcentages entre parenth\u00e8ses sont normalis\u00e9s \u00e0 fr\u00e9quence \u00e9quivalente<\/em><\/p>\n\n<\/p>\n\n
Les nouvelles unit\u00e9s de calculs flottants et SIMD du core Cortex-A72, b\u00e9n\u00e9ficient d’un pipeline plus court permettant de r\u00e9duire les latences jusqu’\u00e0 40%. Ce core int\u00e8gre \u00e9galement un nouveau diviseur Radix-16 FP plus efficace, doublant la bande passante. Ces am\u00e9liorations permettent au core A72 d’afficher des performances en hausse par rapport \u00e0 celles du core Cortex A-57. Mis \u00e0 part dans les tests DGEMM et SFFT, l’A72 fait entre 4% et 57% mieux que l’A57, \u00e0 fr\u00e9quence identique.<\/p>\n\n
<\/p>\n\n
Pour le Kryo, Qualcomm a fait des performances en calcul \u00e0 virgule flottante une priorit\u00e9. L’architecture de ce SoC ressemble en ce sens au core Typhoon d’Apple. Du coup, l’A72 est derri\u00e8re lui de pr\u00e8s de 41%, une fois que l’on a r\u00e9ajust\u00e9 les r\u00e9sultats \u00e0 fr\u00e9quence identique.<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
Contrairement \u00e0 Geekbench, les tests PCMark mesurent plut\u00f4t les performances de l’appareil ou de la plateforme dans son ensemble (CPU, m\u00e9moire et syst\u00e8me de stockage). Le Mate 8 et son SoC Kirin 950 arrive en t\u00eate, d\u00e9passant de 12% le Moto X Pure Edition (Snapdragon 808) et de 24% le Galaxy S6 (Exynos 7420).<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
Le Mate 8 affiche \u00e9galement de tr\u00e8s bons r\u00e9sultats dans nos tests JavaScript (Browsermark, JSBench, Google Octane), d\u00e9passant de 27% en moyenne le Galaxy S6 et \u00e9tant au coude \u00e0 coude avec le Snapdragon 820.<\/p>\n
Performances GPU, Conclusion<\/h2>\n Passons maintenant aux performances GPU gr\u00e2ce \u00e0 plusieurs benchmarks synth\u00e9tiques et pratiques.<\/p>\n\n
<\/p>\n\n
SoC<\/strong><\/th>Kirin 950<\/strong><\/th>Exynos 7420<\/strong><\/th>Apple A8<\/strong><\/th>Apple A9<\/strong><\/th><\/tr>GPU<\/strong><\/th>ARM Mali-T880MP4<\/td> ARM Mali-T760MP8<\/td> PowerVR GX6450<\/td> PowerVR GT7600<\/td><\/tr> Nombre de “cores”<\/strong><\/th>4<\/td> 8<\/td> 4<\/td> 6<\/td><\/tr> ALUs FP32 par “core”<\/strong><\/th>2<\/td> 3<\/td> 32<\/td> 32<\/td><\/tr> ALUs FP16 par “core”<\/strong><\/th>\u2717<\/td> \u2717<\/td> 64<\/td> 64<\/td><\/tr> Total FP32 FLOPS\/cycle<\/strong><\/th>120<\/td> 160<\/td> 256<\/td> 384<\/td><\/tr> Total FP16 FLOPS\/cycle<\/strong><\/th>216<\/td> 288<\/td> 512<\/td> 768<\/td><\/tr> Pixels\/cycle<\/strong><\/th>4<\/td> 8<\/td> 8<\/td> 12<\/td><\/tr> Texels\/cycle<\/strong><\/th>4<\/td> 8<\/td> 8<\/td> 12<\/td><\/tr><\/tbody><\/table><\/div>\n\n Le Kirin 950 utilise un GPU ARM Mali-T880MP4, un mod\u00e8le dot\u00e9 de trois unit\u00e9s ALU par core l\u00e0 o\u00f9 le Mali-T760 n’en poss\u00e8de que deux. L’architecture Midgard des Mali diff\u00e8re des autres architectures sur plusieurs points. Ses unit\u00e9s vectorielles SIMD reposent ainsi exclusivement sur un parall\u00e9lisme au niveau des instructions (ILP) pour garder les diff\u00e9rentes ALU actives, alors que les architectures concurrentes utilisent une combinaison ILP et TLP (Thread Level Parallelism). Chaque m\u00e9thode a ses avantages et ses inconv\u00e9nients. Le nombre d’IPC est \u00e9galement tr\u00e8s variable selon les architectures. Ainsi, les Mali effectuent moins d’op\u00e9rations par cycle que les PowerVR Rogue et Qualcomm Adreno, mais leur fr\u00e9quence maximale est plus \u00e9lev\u00e9e.<\/p>\n\n
<\/p>\n\n
Les diff\u00e9rences d’architecture (et de nomenclature) entre les GPU d’ARM et d’Imagination Technologies rendent donc difficile la simple comparaison \u00ab sur le papier \u00bb, d’autant plus que Qualcomm ne publie tout simplement pas les d\u00e9tails de l’architecture de ses propres GPU Adreno. En r\u00e9sum\u00e9 : rien de mieux que quelques tests pratiques pour d\u00e9partager tous ces pr\u00e9tendants.<\/p>\n\n
<\/p>\n\n
<\/span><\/span><\/span><\/span><\/p>\n\n<\/p>\n\n
Si le GPU du Kirin 950 s’en sort relativement bien dans le premier test de 3D Mark: Ice Storm Unlimited, il souffre beaucoup plus dans le second test, plus lourd. Au final, le Kirin 950 ne parvient \u00e0 se hisser qu’au-dessus du MT6795 de Mediatek. Le score Physics, qui pourtant est cens\u00e9 tester le CPU et les performances m\u00e9moires, est \u00e9trangement faible : l’Exynos 7420 du Galaxy S6 fait 31% de mieux que le Kirin 950.<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
Basemark X utilise le moteur Unity 4.2.2 et tourne sous OpenGL ES 2.0. Ici encore, l’Exynos 7420 et son Mali-T760MP8 sont en moyenne 39% plus rapide que le Kirin 950 et son Mali-T880MP4. Dans le test Dunes qui demande d’afficher de nombreux triangles, le SoC de Samsung est m\u00eame 73% plus rapide.<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
En haute qualit\u00e9, l’\u00e9cart se creuse encore entre le Mali-T760MP8 et le Mali-T880MP4. Avec huit cores GPU contre quatre, la solution de Samsung est jusqu’\u00e0 70% plus rapide (en offscreen).<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
Le test GFXBench Manhattan faut appel \u00e0 un moteur de jeu compatible OpenGL ES 3.0 et utilise le Defered Rendering pour les effets de lumi\u00e8re. Le PowerVR GT7600 et l’Adreno 530 montrent les muscles de leur unit\u00e9 ALU, mais m\u00eame l’Exynos 7420 surpasse le Kirin 950 (de 35%). Le SoC de HiSilicon reste tout de m\u00eame devant le Snapdragon 808.<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
Bien qu’utilisant un moteur de rendu un peu plus ancien, en OpenGL ES 2.0, le test T-Rex donne des r\u00e9sultats similaires.<\/p>\n\n
<\/p>\n\n
<\/div>\n\n
<\/p>\n\n
Le nombre limit\u00e9 de ROPs du Kirin 950 le p\u00e9nalise dans les tests Alpha Blending, permettant m\u00eame au Snapdragon 808 de passer devant. Notons au passage qu’un probl\u00e8me de pilotes explique le score erratique de l’Exynos 7420 (le score \u00ab offscreen \u00bb est plus faible que le score \u00ab onscreen \u00bb).<\/p>\n\n
<\/p>\n\n
Conclusion<\/h3>\n\n <\/p>\n\n
Le Cortex-A72 est clairement une \u00e9volution du Cortex-A57 : \u00e0 premi\u00e8re vue, les deux processeurs sont similaires, mais ARM a apport\u00e9 un certain nombre d’optimisations et d’am\u00e9liorations \u00e0 chaque \u00e9tage du pipeline. La majorit\u00e9 des calculs entiers ne b\u00e9n\u00e9ficient pas d’un gain vraiment important, sauf dans certains cas (encodage par exemple).\u00a0 La diminution de la latence des unit\u00e9s de calcul en virgule flottante permet en revanche un gain imm\u00e9diat, comme le montre le test Geekbench.<\/p>\n\n
<\/p>\n\n
Malgr\u00e9 ces am\u00e9liorations, l’architecture du Cortex-A72 d’ARM est toujours plus limit\u00e9e que celle d’Apple (Twister) ou celle de Qualcomm (Kryo). \u00c0 fr\u00e9quence \u00e9gale, le Kryo est 20% plus rapide en calculs entiers sous Geekbench, et 41% en calculs flottants. Les fr\u00e9quences plus \u00e9lev\u00e9es atteignables par le core A72 permettent toutefois, au moins en partie, de limiter les cons\u00e9quences de son nombre d’IPC plus faible.<\/p>\n\n
<\/p>\n\n
HiSilicon est le premier \u00e0 proposer du Cortex-A72 grav\u00e9 en 16nm FinFET+, et le premier \u00e0 utiliser le nouveau GPU Mali-T880 d’ARM. Cette combinaison affiche une meilleure efficacit\u00e9 \u00e9nerg\u00e9tique et de meilleures performances que le Snapdragon 810. Le Kirin 950 appara\u00eet m\u00eame comp\u00e9titif face au Snapdragon 820, au moins tant qu’on ne fait pas trop appel au GPU.<\/p>\n\n
<\/p>\n\n
\u00c0 premi\u00e8re vue, le choix d’utiliser le Mali-T880 dans une configuration quad-core seulement peut para\u00eetre \u00e9trange, mais un second coup d\u2019\u0153il plus attentif permet de comprendre la logique de HiSilicon : le Kirin 950 est capable de tenir dans les jeux un framerate acceptable, proche de son maximum, sur une longue p\u00e9riode. En pratique, associ\u00e9 \u00e0 un \u00e9cran 1080p comme celui du Mate 8, ce SoC est plus performant que l’Exynos 7420 du Galaxy S6 qui doit lui rapidement diminuer sa fr\u00e9quence GPU \u00e0 cause de la chaleur. Autrement dit, le Kirin 950 ne devrait pas rencontrer de probl\u00e8mes – de performances ou de surchauffe – en conditions r\u00e9elles.<\/p>\n\n
<\/p>\n\n
En associant un CPU performant et un GPU aux caract\u00e9ristiques raisonnables offrant tout de m\u00eame des performances qu’il peut conserver dans le temps sans surchauffer, HiSilicon a donc fait un choix judicieux : celui de l’efficacit\u00e9 \u00e9nerg\u00e9tique.<\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"Le nouveau Kirin 950 de HiSilicon est d\u2019ores et d\u00e9j\u00e0 pr\u00e9sent sur le march\u00e9 puisque c\u2019est ce SoC que l\u2019on trouve \u00e0 l\u2019int\u00e9rieur de l\u2019Huawei Mate 8. B\u00e9n\u00e9ficiant d\u2019une architecture big.LITTLE, ce SoC est un\u2026<\/p>","protected":false},"author":9,"featured_media":86132,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"ep_exclude_from_search":false,"footnotes":""},"categories":[487,4071,4104],"tags":[],"hubs":[],"acf":{"post_show_excerpt":false,"post_source":{"title":"Tom's Hardware US","url":"https:\/\/www.tomshardware.com","target":""}},"yoast_head":"\n
Kirin 950, le CPU le plus rapide sous Android (pour l'instant)<\/title>\n \n \n \n \n \n \n \n \n \n \n \n \n \n \n\t \n\t \n\t \n \n \n \n \n