Accueil » Actualité » L’intelligence artificielle de Google a appris à parler presque comme un humain

L’intelligence artificielle de Google a appris à parler presque comme un humain

Parler comme un robot. La synthèse vocale des ordinateurs est si mauvaise qu’elle est devenue un cliché. Mais on ne pourra bientôt plus se moquer.

Image 1 : L'intelligence artificielle de Google a appris à parler presque comme un humain

L’intelligence artificielle DeepMind de Google a appris un nouveau tour : parler presque aussi naturellement qu’un humain. De quoi donner bientôt vie au vieux rêve d’un assistant cybernétique avec lequel on peut dialoguer comme avec une personne ? Nous en sommes encore loin.

La voix de ses maîtres

L’avancée réalisée par les équipes de DeepMind est tout de même impressionnante. Dans les extraits sonores rendus publics, les progrès par rapport aux méthodes de synthèse vocale traditionnelle sont saisissants. Selon les tests réalisés par Google, les voix sont jugées 50 % plus fidèles que la meilleure des autres méthodes classiques.

Google a créé un réseau neuronal – WaveNet – capable de générer un signal sonore à partir d’un texte brut et de paramètres phonétiques, comme de nombreux systèmes actuels. Mais Wavenet génère des sons plus naturels, grâce à une période d’apprentissage, pendant laquelle il analyse une vaste base d’enregistrements vocaux. La réussite de cette approche originale semble même surprendre ses inventeurs. Et il y a mieux encore : WaveNet peut générer de la musique !