Faire tourner Doom d’id Software (1993) sur n’importe quel support est depuis longtemps l’un des passe-temps préférés des développeurs de toutes sortes. Le FPS mythique, vieux de plus de 30 ans, peut même tourner dans le gestionnaire de tâches de Windows.

Dans sa recherche sur l’intelligence artificielle, Google s’est récemment servi de Doom pour mettre en avant sa nouvelle technologie : GameNGen. Ce moteur de jeu alimenté par l’IA serait capable de générer chaque image du jeu en temps réel et en fonction des actions du joueur.

Cela représente une avancée conséquente dans ce domaine de la high-tech et préfigure un avenir particulièrement intéressant pour les outils de génération d’images. Utilisées par les joueurs afin de lisser leur expérience de jeu et gagner quelques images par seconde, ces technologies sont devenues quasiment incontournables et bénéficient d’améliorations régulières.

Néanmoins, que ce soit le DLSS 3 de NVIDIA ou l’AFMF 2 d’AMD, aucune n’est au niveau du GameNGen de Google. Après tout, le moteur de la firme de Mountain View est capable de recréer un jeu entier. Certes, il est suffisamment peu gourmand pour tourner sur une calculatrice, mais le fait de générer chacune des images du jeu en temps réel reste impressionnant.

Google recréer Doom grâce à l’IA

Pour arriver à ce résultat, les équipes de Google ont entraîné leur IA spécifiquement sur le FPS d’id Software. Elles ont ensuite chargé une version modifiée de Stable Diffusion (un outil de génération d’images) de recréer le jeu. Afin d’améliorer le rendu graphique et le travail d’inférence de l’IA, les développeurs ont chiffré les frames du jeu à l’aide de bruit gaussien.

Évidemment, bien que la technologie soit performante, elle a également ses limites. Le jeu est certes extrêmement bien rendu, mais le manque de “support physique” des images sur lequel l’IA peut se baser afin d’en générer de nouvelles réduit la qualité graphique globale du titre.

Chaque image étant générée indépendamment des autres, cela résulte en l’apparition d’artefacts visuels ainsi qu’une baisse de la cohérence. Sur GameNGen, Doom tourne malgré tout à 20 FPS. Cela peut sembler peu, cependant, le fait que chaque image soit générée par l’IA rend le travail de Google véritablement impressionnant.

Actuellement, les outils de génération de frames se contentent d’une ou deux images générées par l’IA, intercalées entre celles calculées normalement. Seul l’outil Lossless Scaling propose de quadrupler les FPS en interpolant trois images.

La capacité de GameNGen à générer dix fois plus d’images que les technologies courantes est donc assez éloquente. Certes, la qualité et la fluidité ne sont pas encore au rendez-vous, mais cela reste un tour de force. Il serait intéressant, à l’avenir, de voir Google partager ses avancées avec d’autres développeurs ou tout simplement les inspirer afin d’améliorer encore les outils à disposition des joueurs.

