Google vient de présenter un nouveau modèle d’intelligence artificielle multimodale appelé Veo. Celui-ci est un concurrent direct à l’IA Sora d’OpenAI et serait capable de générer des vidéos d’une qualité assez impressionnante.
Le premier jour de la conférence I/O de Google a été consacré principalement aux avancées de l’entreprise dans le domaine de l’intelligence artificielle. La firme de Mountain View a profité de l’occasion pour présenter une version améliorée de son IA multimodale Gemini mais aussi de nouveaux projets.
L’un d’eux semble être une réponse directe à Sora, l’IA vidéo d’OpenAI et à Stable Video Diffusion. Nommée Veo, cette nouvelle intelligence artificielle devrait permettre aux utilisateurs de générer des vidéos grâce à des invites textuelles et multimédias (audio et vidéo).
Selon Google ainsi que sa présentation, l’intelligence artificielle semble particulièrement impressionnante. Elle serait notamment capable de créer des clips de haute qualité en 1080p, dépassant les 60 secondes. C’est aussi bien que ce que propose Sora (une minute et une seconde) et mieux que les 25 à 30 secondes de vidéo générées par Stable Diffusion.
De plus, les vidéos créées par Veo sont très personnalisables. L’IA ayant accès à une large gamme de styles cinématographiques et pouvant modifier le contenu généré grâce à des invites supplémentaires.
La présentation de Veo peut-elle être truquée ?
Si d’après ses créateurs Veo génère des vidéos plus cohérentes et réalistes que d’autres outils similaires, ses capacités réelles peuvent laisser songeur. Il est possible voire probable que Google ait amélioré artificiellement la présentation de Veo lors de la conférence I/O.
Ainsi, son IA pourrait ne pas être aussi performante que prévu. Ce ne serait pas la première fois que l’entreprise agit de la sorte, la première présentation de Gemini ayant été truquée lors de sa diffusion.
Qui plus est, le rival principal de Veo n’a pas non plus échappé à ce genre de pratique. La présentation de Sora “Air head” ayant été modifiée avec le logiciel de montage After Effects. Il n’est donc pas impensable, compte tenu de l’historique de Google et du comportement général de l’industrie de l’IA, que Veo ait subi le même sort.
Néanmoins, la présentation de l’intelligence artificielle de Google reste impressionnante si celle-ci est authentique. L’IA et ses outils de génération devraient être utilisables par tous. Que ce soit les professionnels du cinéma ou les créateurs de contenu puisque certaines des fonctionnalités de Veo devraient être intégrées à Youtube Shorts.
Veo devrait être disponible plus tard cette année. Il est d’ores et déjà possible de s’inscrire sur liste d’attente mais celle-ci est limitée à certaines régions (dont la France et certains pays francophones). Il faut espérer que celle-ci se montrera à la hauteur des attentes et fidèle à ce que Google a présenté.
- Google, lors de sa conférence I/O, a présenté une nouvelle intelligence artificielle multimodale : Veo.
- Celle-ci est capable de générer des vidéos réalistes de plus de 60 secondes en HD 1080p.
- Google Veo devrait être disponible cette année. Il est possible de s’inscrire sur une liste d’attente pour tester l’IA.