Kunlun : processeur chinois très avancé pour l’intelligence artificielle

Première puce cloud-to-edge en Chine

Baidu annonce une nouvelle puce dédiée à l’intelligence artificielle : Kunlun, une puce FPGA. La version 818-300 pour l’apprentissage est annoncée compatible avec la plupart des algorithmes de deep learning, et la version 818-100 destinée à l’inférence proposerait un large panel d’applications de l’IA comme la reconnaissance vocale, le traitement automatique du langage naturel, le filtrage et classement d’informations ou encore la conduite autonome.

Un meilleur rendement énergétique ?

Kunlun intègre plusieurs milliers de cœurs, et sera gravée par Samsung en 14 nm. D’après Baidu, elle offre une très large bande passante mémoire de 512 Go/s et serait capable de 260 TOPS pour 100 Watts consommés. Les comparaisons sont assez flous dans le secteur. On sait que le dernier TPU 3 de Google affiche environ 360 TFLOPS TensorFlow par puce (sans connaître la consommation), qu’un GPU NVIDIA Volta est à 125 TFLOPS TensorFlow, mais difficile de dire si la précision des calculs est vraiment comparable. Notez que Baidu déclare également que Kunlun est 30 fois plus rapide que son circuit logique programmable précédent (basé sur des GPU).